Skip to content

Instantly share code, notes, and snippets.

View fernandobarbalho's full-sized avatar

Fernando Almeida Barbalho fernandobarbalho

View GitHub Profile
@fernandobarbalho
fernandobarbalho / get_covid_data_jhu.r
Last active December 13, 2021 23:21
Function to create COVID-19 dataset from JHU github
get_covid_data_jhu<- function(dt_ini, dt_fim, us_columns = TRUE, country = NULL ){ #data inicial para o download, data final para o download, indicação se trabalha com colunas dos EUA (TRUE por default) e lista de países (todos por default)
library(dplyr)
#cria um vetor de datas que vai ser iterado na formação do endereço de github que tem os dados
dates<- c(lubridate::ymd(dt_ini):lubridate::ymd(dt_fim))
#O map_dfr vai montar dinamicamente um único dataframe com as para todas as datas do array
purrr::map_dfr(dates, function(a_date){
@fernandobarbalho
fernandobarbalho / generate_sankey_graph_fed_gov_revenue.r
Created May 27, 2020 16:01
Script to generate a sankey graph of the brazilian government revenue
devtools::install_github("tchiluanda/rsiconfi")
library(rsiconfi)
library(networkD3)
library(tidyverse)
#Get data in SICONFI for budget revenue (Ï-C) related to the federal government entity (1) in 2018
df_rec <- rsiconfi::get_dca(2018,"I-C","1")
# find hierachical strtucture of budget revenue
@fernandobarbalho
fernandobarbalho / ranking_favoritos_twitter.r
Last active October 2, 2020 15:30
Script para gerar ranking de favoritos no twitter
library(rtweet)
library(dplyr)
library(ggplot2)
df_favorite<- rtweet::get_favorites("@barbalhofernand", n=3000)
users_favorite<-
df_favorite %>%
group_by(screen_name, user_id) %>%
@fernandobarbalho
fernandobarbalho / process_sim_all_fu.r
Last active May 23, 2020 23:39
Função para baixar dados de todas ufs para o sistema SIM
#para essa função usa-se o pacote microdatasus
# SALDANHA, Raphael de Freitas; BASTOS, Ronaldo Rocha; BARCELLOS, Christovam. Microdatasus: pacote para download e pré-processamento de microdados do Departamento de Informática do SUS (DATASUS). Cad. Saúde Pública, Rio de Janeiro , v. 35, n. 9, e00032419, 2019 . Available from http://ref.scielo.org/dhcq3y.
process_SIM_all_fu<- function(a_year_start, a_year_end){
library(microdatasus)
library(dplyr)
library(purrr)
library(readr)
@fernandobarbalho
fernandobarbalho / get_last_covid_rt.r
Last active April 16, 2020 19:15
Function that returns the last estimated rt from a time series of cummulative number of COVID-19 cases
#based on this method: https://github.com/k-sys/covid-19/blob/master/Realtime%20R0.ipynb
# In fact it is a translation from python to R of some parts of the code explained in the link above.
get_last_covid_rt<- function(df_days_case){ #this dataset must have a structre with a collumn no_cases (accumulated number of cases on a given sequence day)
#smooth the data
x <- 1:NROW(df_days_case)
y<-df_days_case$no_cases
#O script abaixo consome dados consolidados de bolsa família para todos os municípios
#Como o script demora muito, considere fazer alterações para fazer filtros antes do segundo pull
ano<-2014
pbf_mun<- owdbr::uflist() %>%
pull(num)%>%
map_dfr(munlist) %>%
pull(codigo_municipio_completo) %>%
map_dfr(getpbf_mun,AAAA= ano)
@fernandobarbalho
fernandobarbalho / download_bolsa_familia.R
Last active June 25, 2023 16:03
Script para download de base de dados de bolsa família
#Faça download de um conjunto de tabelas do bolsa família referente a qualquer período a partir de janeiro de 2003
base_address<- "http://transparencia.gov.br/download-de-dados/bolsa-familia-pagamentos/"
#Alterar as variáveis abaixo de acordo com o que se deseja
ano_ini<- 2018
ano_fim<- 2018
mes_ini<-1
ult_mes_disp<- 2
@fernandobarbalho
fernandobarbalho / ETL_pensionistas.R
Created January 14, 2020 15:05
ETL para tratar dados de pensionsitas
library(readr)
library(dplyr)
PENSIONISTAS_112019 <- read_delim("Data/PENSIONISTAS_112019.csv",
";", escape_double = FALSE, locale = locale(decimal_mark = ",",
grouping_mark = ".", encoding = "LATIN1"),
trim_ws = TRUE)
PENSIONISTAS_122019 <- read_delim("Data/PENSIONISTAS_122019.csv",
";", escape_double = FALSE, locale = locale(decimal_mark = ",",
@fernandobarbalho
fernandobarbalho / script_indice_FIRJAN.R
Last active May 25, 2021 17:33
Script para cálculo do índice de autonomia da FIRJAN usando o pacote rsiconfi
# install.packages("devtools")
devtools::install_github("tchiluanda/rsiconfi")
library(rsiconfi)
library(dplyr)
library(tidyr)
###########Trabalhando as despesas
#Monta um vetor com todos os códigos de UFs do Brasil
@fernandobarbalho
fernandobarbalho / gist:40f7e6c0cf925065e21084062e5ad513
Last active August 9, 2022 20:55
script para leitura e tratamento de tabela do ibama sobre oleamento de praias do NE
library(tabulizer)
library(dplyr)
setwd("~/GitHub/oleogate/data")
#Extrai tabelas do arquivo pdf.
#Esse arquivo foi baixado do seguinte link
# https://politica.estadao.com.br/blogs/estadao-verifica/wp-content/uploads/sites/690/2019/10/Ibama.pdf
#A tabela é extraída para um arquivo csv de forma a poder trabalhar melhor questões de encoding
tabulizer::extract_tables("ibama.pdf", output = "csv",outdir = getwd())