Skip to content

Instantly share code, notes, and snippets.

@metodologia
Last active December 17, 2015 00:09
Show Gist options
  • Save metodologia/5518660 to your computer and use it in GitHub Desktop.
Save metodologia/5518660 to your computer and use it in GitHub Desktop.
Microdados com R - Código 2
# limpar memória do R
rm(list=ls(all=TRUE))
# indicar diretório de trabalho
setwd('~/Documents/R-workspace/2013 tutorial microdados')
# mostrar até 8 casas decimais
options("scipen" = 8)
# listar arquivos do diretório de trabalho
dir()
# ----------------------------------------------
# informações a serem retiradas da PNAD 2011
#
# Nome Inicio Tamanho Descrição
# V0101 1 4 Ano de referencia
# UF 5 2 Unidade da Federação
# V0302 18 1 Sexo
# V8005 27 3 Idade em anos
# V0404 33 1 Cor ou raça
# V4011 43 1 Estado civil
# V06111 86 1 Internet
# V06112 87 1 Internet móvel
# V9906 153 4 Código da ocupação
# V9008 162 2 Posição na ocupação
# V9532 321 12 Rendimento mensal
# V4729 751 5 Peso pessoa
# Nome Inicio Tamanho
# V0101 1 4
# UF 5 2
# controle 11
# V0302 18 1
# skip2 8
# V8005 27 3
# skip3 3
# V0404 33 1
# skip4 9
# V4011 43 1
# skip5 42
# V06111 86 1
# V06112 87 1
# skip6 65
# V9906 153 4
# skip7 5
# V9008 162 2
# skip8 157
# V9532 321 12
# skip9 418
# V4729 751 5
# skip10 1
# ----------------------------------------------
# utilizando a função read.fwf para ler o arquivo txt
pes2011 <- read.fwf(file='2011_PES.TXT', widths=c(4,2,11,1,8,3,3,1,9,1,42,1,1,65,4,5,2,157,12,418,5,1))
# dimensão da base de dados (tabela)
dim(pes2011)
# nomes das variáveis
names(pes2011)
# analisar primeiras 20 linhas
head(pes2011,20)
# acrescentar nomes nas variáveis
names(pes2011) <- c("V0101","UF","controle","V0302","skip2","V8005","skip3","V0404","skip4","V4011","skip5","V06111","V06112","skip6","V9906","skip7","V9008","skip8","V9532","skip9","V4729","skip10")
# selecionar apenas algumas variáveis da base de dados
pes2011b <- subset(pes2011, select=c("V0101","UF","controle","V0302","V8005","V0404","V4011","V06111","V06112","V9906","V9008","V9532","V4729"))
# analisar primeiras 20 linhas
head(pes2011b,20)
# estrutura das variáveis
str(pes2011b)
# selecionar apenas os arquitetos
pes2011c <- subset(pes2011b, V9906==2141)
# dimensão da tabela
dim(pes2011c)
# listar os itens da memória do R
ls()
# limpar a memória do R
rm(pes2011,pes2011b)
# estatísticas descritivas básicas
summary(pes2011c)
# eliminar o rendimento V9532=999999999999 sem declaração
pes2011d <- subset(pes2011c, V9532!=999999999999)
# dimensão da tabela
dim(pes2011d)
# estatísticas descritivas básicas
summary(pes2011d$V9532)
# tabelas
table(pes2011d[["V9532"]],pes2011d[["V0302"]])
table(pes2011d[["V0404"]],pes2011d[["V0302"]])
table(pes2011d[["V8005"]],pes2011d[["V0404"]])
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment