metodologia · December 17, 2015 00:09
diff --git a/gistfile1.r b/gistfile1.r
 # limpar memória do R
 rm(list=ls(all=TRUE))
 # indicar diretório de trabalho
 setwd('~/Documents/R-workspace/2013 tutorial microdados')
 # mostrar até 8 casas decimais
 options("scipen" = 8)
 # listar arquivos do diretório de trabalho
 dir()
 # ----------------------------------------------
 # informações a serem retiradas da PNAD 2011
 #
 # Nome  	Inicio	Tamanho		Descrição
 # V0101 	1	4 		Ano de referencia
 # UF 		5	2		Unidade da Federação
 # V0302		18	1		Sexo
 # V8005		27	3		Idade em anos
 # V0404		33	1		Cor ou raça
 # V4011		43	1		Estado civil
 # V06111	86	1		Internet
 # V06112	87	1		Internet móvel
 # V9906		153	4		Código da ocupação
 # V9008		162	2		Posição na ocupação
 # V9532		321	12		Rendimento mensal
 # V4729		751	5		Peso pessoa
 # Nome		Inicio	Tamanho	
 # V0101 	1	4 	
 # UF 		5	2	
 # controle		11
 # V0302		18	1
 # skip2			8	
 # V8005		27	3
 # skip3			3	
 # V0404		33	1	
 # skip4			9
 # V4011		43	1
 # skip5			42	
 # V06111	86	1	
 # V06112	87	1
 # skip6			65
 # V9906		153	4
 # skip7			5		
 # V9008		162	2
 # skip8			157	
 # V9532		321	12	
 # skip9			418
 # V4729		751	5
 # skip10		1
 # ----------------------------------------------
 # utilizando a função read.fwf para ler o arquivo txt
 pes2011 <- read.fwf(file='2011_PES.TXT', widths=c(4,2,11,1,8,3,3,1,9,1,42,1,1,65,4,5,2,157,12,418,5,1))	
 # dimensão da base de dados (tabela)
 dim(pes2011)
 # nomes das variáveis
 names(pes2011)
 # analisar primeiras 20 linhas
 head(pes2011,20)
 # acrescentar nomes nas variáveis
 names(pes2011) <- c("V0101","UF","controle","V0302","skip2","V8005","skip3","V0404","skip4","V4011","skip5","V06111","V06112","skip6","V9906","skip7","V9008","skip8","V9532","skip9","V4729","skip10")
 # selecionar apenas algumas variáveis da base de dados
 pes2011b <- subset(pes2011, select=c("V0101","UF","controle","V0302","V8005","V0404","V4011","V06111","V06112","V9906","V9008","V9532","V4729"))
 # analisar primeiras 20 linhas
 head(pes2011b,20)
 # estrutura das variáveis
 str(pes2011b)
 # selecionar apenas os arquitetos
 pes2011c <- subset(pes2011b, V9906==2141)
 # dimensão da tabela
 dim(pes2011c)
 # listar os itens da memória do R
 ls()
 # limpar a memória do R
 rm(pes2011,pes2011b)
 # estatísticas descritivas básicas
 summary(pes2011c)
 # eliminar o rendimento V9532=999999999999 sem declaração
 pes2011d <- subset(pes2011c, V9532!=999999999999)
 # dimensão da tabela
 dim(pes2011d)
 # estatísticas descritivas básicas
 summary(pes2011d$V9532)
 # tabelas
 table(pes2011d[["V9532"]],pes2011d[["V0302"]])
 table(pes2011d[["V0404"]],pes2011d[["V0302"]])
 table(pes2011d[["V8005"]],pes2011d[["V0404"]])
	# limpar memória do R
	rm(list=ls(all=TRUE))
	# indicar diretório de trabalho
	setwd('~/Documents/R-workspace/2013 tutorial microdados')
	# mostrar até 8 casas decimais
	options("scipen" = 8)
	# listar arquivos do diretório de trabalho
	dir()
	# ----------------------------------------------
	# informações a serem retiradas da PNAD 2011
	#
	# Nome Inicio Tamanho Descrição
	# V0101 1 4 Ano de referencia
	# UF 5 2 Unidade da Federação
	# V0302 18 1 Sexo
	# V8005 27 3 Idade em anos
	# V0404 33 1 Cor ou raça
	# V4011 43 1 Estado civil
	# V06111 86 1 Internet
	# V06112 87 1 Internet móvel
	# V9906 153 4 Código da ocupação
	# V9008 162 2 Posição na ocupação
	# V9532 321 12 Rendimento mensal
	# V4729 751 5 Peso pessoa
	# Nome Inicio Tamanho
	# V0101 1 4
	# UF 5 2
	# controle 11
	# V0302 18 1
	# skip2 8
	# V8005 27 3
	# skip3 3
	# V0404 33 1
	# skip4 9
	# V4011 43 1
	# skip5 42
	# V06111 86 1
	# V06112 87 1
	# skip6 65
	# V9906 153 4
	# skip7 5
	# V9008 162 2
	# skip8 157
	# V9532 321 12
	# skip9 418
	# V4729 751 5
	# skip10 1
	# ----------------------------------------------
	# utilizando a função read.fwf para ler o arquivo txt
	pes2011 <- read.fwf(file='2011_PES.TXT', widths=c(4,2,11,1,8,3,3,1,9,1,42,1,1,65,4,5,2,157,12,418,5,1))
	# dimensão da base de dados (tabela)
	dim(pes2011)
	# nomes das variáveis
	names(pes2011)
	# analisar primeiras 20 linhas
	head(pes2011,20)
	# acrescentar nomes nas variáveis
	names(pes2011) <- c("V0101","UF","controle","V0302","skip2","V8005","skip3","V0404","skip4","V4011","skip5","V06111","V06112","skip6","V9906","skip7","V9008","skip8","V9532","skip9","V4729","skip10")
	# selecionar apenas algumas variáveis da base de dados
	pes2011b <- subset(pes2011, select=c("V0101","UF","controle","V0302","V8005","V0404","V4011","V06111","V06112","V9906","V9008","V9532","V4729"))
	# analisar primeiras 20 linhas
	head(pes2011b,20)
	# estrutura das variáveis
	str(pes2011b)
	# selecionar apenas os arquitetos
	pes2011c <- subset(pes2011b, V9906==2141)
	# dimensão da tabela
	dim(pes2011c)
	# listar os itens da memória do R
	ls()
	# limpar a memória do R
	rm(pes2011,pes2011b)
	# estatísticas descritivas básicas
	summary(pes2011c)
	# eliminar o rendimento V9532=999999999999 sem declaração
	pes2011d <- subset(pes2011c, V9532!=999999999999)
	# dimensão da tabela
	dim(pes2011d)
	# estatísticas descritivas básicas
	summary(pes2011d$V9532)
	# tabelas
	table(pes2011d[["V9532"]],pes2011d[["V0302"]])
	table(pes2011d[["V0404"]],pes2011d[["V0302"]])
	table(pes2011d[["V8005"]],pes2011d[["V0404"]])