Skip to content

Instantly share code, notes, and snippets.

View fernandobarbalho's full-sized avatar

Fernando Almeida Barbalho fernandobarbalho

View GitHub Profile
#O script abaixo consome dados consolidados de bolsa família para todos os municípios
#Como o script demora muito, considere fazer alterações para fazer filtros antes do segundo pull
ano<-2014
pbf_mun<- owdbr::uflist() %>%
pull(num)%>%
map_dfr(munlist) %>%
pull(codigo_municipio_completo) %>%
map_dfr(getpbf_mun,AAAA= ano)
@fernandobarbalho
fernandobarbalho / get_last_covid_rt.r
Last active April 16, 2020 19:15
Function that returns the last estimated rt from a time series of cummulative number of COVID-19 cases
#based on this method: https://github.com/k-sys/covid-19/blob/master/Realtime%20R0.ipynb
# In fact it is a translation from python to R of some parts of the code explained in the link above.
get_last_covid_rt<- function(df_days_case){ #this dataset must have a structre with a collumn no_cases (accumulated number of cases on a given sequence day)
#smooth the data
x <- 1:NROW(df_days_case)
y<-df_days_case$no_cases
@fernandobarbalho
fernandobarbalho / process_sim_all_fu.r
Last active May 23, 2020 23:39
Função para baixar dados de todas ufs para o sistema SIM
#para essa função usa-se o pacote microdatasus
# SALDANHA, Raphael de Freitas; BASTOS, Ronaldo Rocha; BARCELLOS, Christovam. Microdatasus: pacote para download e pré-processamento de microdados do Departamento de Informática do SUS (DATASUS). Cad. Saúde Pública, Rio de Janeiro , v. 35, n. 9, e00032419, 2019 . Available from http://ref.scielo.org/dhcq3y.
process_SIM_all_fu<- function(a_year_start, a_year_end){
library(microdatasus)
library(dplyr)
library(purrr)
library(readr)
@fernandobarbalho
fernandobarbalho / ranking_favoritos_twitter.r
Last active October 2, 2020 15:30
Script para gerar ranking de favoritos no twitter
library(rtweet)
library(dplyr)
library(ggplot2)
df_favorite<- rtweet::get_favorites("@barbalhofernand", n=3000)
users_favorite<-
df_favorite %>%
group_by(screen_name, user_id) %>%
@fernandobarbalho
fernandobarbalho / generate_sankey_graph_fed_gov_revenue.r
Created May 27, 2020 16:01
Script to generate a sankey graph of the brazilian government revenue
devtools::install_github("tchiluanda/rsiconfi")
library(rsiconfi)
library(networkD3)
library(tidyverse)
#Get data in SICONFI for budget revenue (Ï-C) related to the federal government entity (1) in 2018
df_rec <- rsiconfi::get_dca(2018,"I-C","1")
# find hierachical strtucture of budget revenue
@fernandobarbalho
fernandobarbalho / get_covid_data_jhu.r
Last active December 13, 2021 23:21
Function to create COVID-19 dataset from JHU github
get_covid_data_jhu<- function(dt_ini, dt_fim, us_columns = TRUE, country = NULL ){ #data inicial para o download, data final para o download, indicação se trabalha com colunas dos EUA (TRUE por default) e lista de países (todos por default)
library(dplyr)
#cria um vetor de datas que vai ser iterado na formação do endereço de github que tem os dados
dates<- c(lubridate::ymd(dt_ini):lubridate::ymd(dt_fim))
#O map_dfr vai montar dinamicamente um único dataframe com as para todas as datas do array
purrr::map_dfr(dates, function(a_date){
#Criar gráfico de sankey
df_desp <- rsiconfi::get_dca(2018,"I-D","1")
df_desp_trabalho<-
df_desp %>%
#filter(stringr::str_starts(cod_conta,"R")) %>%
filter(coluna == "Despesas Liquidadas") %>%
mutate(nivel_0 = cod_conta =="TotalDespesas" ) %>%
# install.packages("devtools")
# devtools::install_github("tchiluanda/rsiconfi")
#Criar gráfico de sankey
df_desp <- get_dca(2018,"I-D","1")
df_desp_trabalho<-
df_desp %>%
@fernandobarbalho
fernandobarbalho / calcula_valor_constante.r
Last active July 27, 2023 23:51
Calcula valores econômicos para uma data considerando conversão de moedas
calcula_valor_constante <- function(df_dados_hist, data_constante ){
#Argumentos
#df_dados_hist: dataframe em que as duas primeiras colunas são formadas por uma data (Y-m-d) e um valor
#data_constante: data para gerar valor constante. Formato da data: Y-m-d
#Por enquanto as datas estão limitadas à da série temporal baixada do IPCA Total do portal de dados abertos do BACEN
#Essa série começa em 1992-01-01
library(dplyr)
library(lubridate)
library(readxl)
library(readr)
library(tidyverse)
library(lubridate)
library(rsiconfi)
arquivo_geral <- read_excel("HIST_PAINEL_COVIDBR_30jun2020.xlsx",
col_types = c("text", "text", "numeric",
"text", "numeric", "numeric", "numeric",
"date", "numeric", "text", "numeric",