Entradas

R 4.5 vs R 4.4.3

Imagen
Cuando comparto con mis colegas, sobre todo de trabajo que es mi nicho profesional, acerca de porque tener las últimas versiones del software y que replico sobre todo por dos vertientes: mejor desempeño y funcionalidad del software, y la seguridad que pareciera que las empresas de software recomiendan los mismo o algo cercano a esto. Por ejemplo, veamos lo que nos dice Oracle (dueño de Java) acerca de su versión 8 del Java SE.   En la tabla de la página de Oracle podemos observar las fechas en los cuales ya no habrá soporte para ciertas versiones de Java. En este breve artículo veremos en el caso del interprete de R como se desempeña en una versión con respecto a la más reciente. Los puestos de trabajo que se registran por los patrones en el IMSS ha sido una cifra que muestra el avance o retroceso de como se encuentra el empleo en nuestro país, en este caso diremos que en el sector formal. Los microdatos oscilan arriba de los 20 millones y para su procesamiento es necesario o divi...

La librería openxlsx

Imagen
En el Instituto se utiliza como herramienta de trabajo institucional la suite de ofimática MS Office que ofrece un precio asequible aunque lo actual en el mundo del software es el esquema de suscripciones el que casi se ha convertido en el común de las empresas gigantes de las tecnologías de la información. Es por ello que si bien en un principio que se usaban las bibliotecas XLConnectJars   y XLConnect, al tratar de bajarlas e instalarlas se descubrió - en aquel entonces - que estaban obsoletas. Es por ello que se volteo a la que revisaremos superficialmente en este artículo. Lo primero como siempre es descargar la librería openxlsx que se puede hacer desde el mismo Posit RStudio. Vamos a recrear un cuadro existente en el sitio del Instituto que debido a la crisis sanitaria iniciada en 2020 cobra una relevancia muy importante: "Las principales causas de muerte" que de forma anecdótica   fue la primera aplicación en la cual me pidieron que participara, un programa escri...

Repensando RMarkdown (un paréntesis)

Imagen
Siempre recuerdo a nuestro colega José Luis Mu, un experto en el sistema operativo Linux , al hacer una reflexión sobre la complejidad que rodea a este ecosistema, el me compartía la siguiente reflexión (una aproximación de sus palabras que la mente ya no da tanto) "...no es difícil ( Linux ) y si fuera así, ¿no estudiamos para atender cosas complejas?". Así pasa con RMarkdown y en un principio con R, siempre comento que al ver el código fuente a pesar que ya tengo a cuestas quizás más de 10 diferentes lenguajes de programación sentía que veía tipografía del alfabeto chino. Mi colega, el doctor Roussell Toraya, fue el pagano que a petición mía se enfrentó al RMarkdown  al igual que otros compañeros, mientras yo sorteaba una y otra vez esta tecnología con cierto grado de convencimiento que no lo necesitaba, sin embargo ahora cursando un posgrado ya no tuve opción y lo enfrentamos, ahora, con renovados bríos. A la mente me vienen cosas que les he dado la vuelta como la taquime...

Función para cruzar variables de la librería survey (svyby())

Imagen
Volviendo al problema que motivo estos artículos: Número de personas de 15 a 24 años que abandonaron la escuela por razón de que se unió, casó o embarazó por entidad federativa y sexo. Y se hacía la reflexión que hacer el cálculo caso por caso implicaría un código no óptimo. Por lo que vamos simplemente a hacer la consulta inicial, es decir sin tomar en cuenta la entidad ni el sexo. #Se cargan las librerías library ( survey ) library ( dplyr ) # Se define el directorio de trabajo setwd ( "D:/2024/Requerimiento_enut_Jairo/2019" ) #importo a un dataframe el conjunto de datos (Archivo csv) del sociodemográfico df_sd <- read.csv ( "conjunto_de_datos_tsdem_enut_2019.csv" ) #importo a un dataframe el conjunto de datos (Archivo csv) de la vivienda df_viv <- read.csv ( "conjunto_de_datos_tvivienda_enut_2019.csv" ) #importar la columna entidad de otro conjunto de datos con left_join() df_join_sd_viv <- left_join ( df_sd , df_viv , c ( "UPM...

Nuevamente la librería survey.

Imagen
Ahora bien, surge una segunda pregunta: ¿el dato se puede obtener por sexo y por entidad? Sí, si se puede, pero la siguiente pregunta en el argot de los estadísticos es “¿si da la muestra para tales resultados?”. Si nos vamos a los documentos de la encuesta podemos ver en la nota técnica lo siguiente: Características metodológicas de la ENUT 2019 Unidad de análisis: Hogares e integrantes del hogar de 12 años y más. Población objetivo: Población de 12 años y más. Instrumento de captación: Cuestionario de preguntas predefinidas sobre actividades de uso del tiempo. Método de captación: Entrevista directa a cada uno de los integrantes de 12 años y más en el hogar mediante dispositivo móvil. Periodo de levantamiento: Del 21 de octubre al 01 de diciembre de 2019.  Desglose geográfico Nacional: por tamaño de localidad (10 mil y más habitantes, y menos de 10,000 habitantes) y entidad federativa.  Tamaño de la muestra: 26 631 viviendas y 71 404 personas de 12 años y más que repre...