Entradas

Mostrando entradas de enero, 2021

Los conteos de registros con dplyr con condiciones

Imagen
Seguimos con esta serie de artículos que tiene el propósito de apoyar a personas que como yo inician en el mundo de R y de alguna manera a la ciencia de datos, así como para mi es una especie de cuaderno de notas digital. El archivo con el que ejemplificó está en el sitio de INEGI y es la información de registros administrativos referentes a la estadística de mortalidad, en este caso específico para el año 2019. Una gran amiga doctora, me consultó sobre como obtener causas de muerte de menores de edad con estos datos. Una vez que descargamos el archivo lo que tenemos que hacer es crear el código en R para abrir este archivo en formato CSV usando Spark . Para lo cual usamos las siguientes instrucciones: library(sparklyr) library(dplyr) config <- spark_config() config$`sparklyr.shell.driver-memory` <- "16G" config$spark.memory.fractions <- 0.7 sc <- spark_connect(master="local", config = config) defun19 <- spark_read_csv(sc, name = "defun19&quo