Skip to content

Instantly share code, notes, and snippets.

@rocarvaj
Last active February 14, 2022 17:22
Show Gist options
  • Select an option

  • Save rocarvaj/1b9587518ee4373aa5d4ebee94bf4116 to your computer and use it in GitHub Desktop.

Select an option

Save rocarvaj/1b9587518ee4373aa5d4ebee94bf4116 to your computer and use it in GitHub Desktop.
Algunos comandos más usados de R (Taller de Data Analytics UAI 2019) #R

Lista de comandos útiles

Nota: Varios de estos comandos pertenecen al Tidyverse, por lo que se asume que se ha instalado y cargado tidyverse.

Generales

Comando Descripción Ejemplo
install.packages() Instalar paquete (es necesario hacer sólo una vez) install.packages("tidyverse")
library() Cargar paquete library(tidyverse)
read_csv() Cargar datos en formato .csv (separado por comas) read_csv("carpeta/misdatos.csv")
read_excel() Cargar datos desde un archivo Excel (requiere cargar paquete readxl) read_excel("misdatos.xlsx", sheet = "Hoja1")
glimpse() Entrega un resumen de un data frame (variables y observaciones) glimpse(mpg)
$ Seleccionar una variable de un data frame dataframe$edad
table() Generar una tabla de frecuencia para la(s) variable(s) table(dataframe$comuna, dataframe$carrera)

Manipulación de datos (dplyr)

Nota: Como varios de estos comandos se usan usualmente con el operador "pipe" (%>%), en los ejemplos usamos df como nombre del data frame sobre el cual se aplica la función.

Comando Descripción Ejemplo
filter() Seleccionar (filtrar) observaciones (filas) de un data frame df %>% filter(edad >= 18 & comuna == "Concon")
select() Seleccionar variables (columnas) de un data frame df %>% select(edad, comuna, carrera)
Al usar select() con - se seleccionan todas las variables, excepto las indicadas df %>% select(-comuna)
rename() Renombrar variables de un data frame df %>% rename(edad = edad.del.individuo)
mutate() Modificar variables y entregar el resultado en otra variable df %>% mutate(ptos.totales = ptos.local + ptos.visita)
summarise() Generar alguna estadística a partir de las variables del data frame (reducir varios valores a uno solo) df %>% summarise(edad.promedio = mean(edad))
group_by() Agrupar las observaciones según una o más variables para luego calcular alguna estadística por grupo df %>% group_by(carrera) %>% summarise(edad.promedio = mean(edad))
arrange() Reordenar observaciones según una o más variables (usar - para orden descendiente) df %>% arrange(edad, -ingresos)

Modelos

Comando Descripción Ejemplo
lm() Modelo de regresión lineal lm(var.dep ~ var1 + var2 + var 3, data = df)
glm() Modelo lineal generalizado (usar family = binomial para reg. logísitca) glm(var.dep ~ var1 + var2, data = df, family = binomial)
summary() Obtener un resumen del modelo y su calidad summary(modelo)
predict() Usar un modelo para predecir el valor de la variable dependiente para nuevas observaciones predict(modelo, newdata = otrodf)
Para regresiones logísticas, usar el parámetro type = "response" predict(modelolog, type = "response", newdata = otrodf)
sample.split() Dividir una base de datos para generar set de entrenamiento y de prueba (requiere el paquete caTools) indices <- sample.split(df$var.dep, SplitRatio = 0.75)
Luego de generar indices, se seleccionan las observaciones correspondientes desde el data frame original dftrain <- df[indices, ]
@mrxalexandre
Copy link
Copy Markdown

Hi!
Can you help me, about Cplex with cpp?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment