Ir al contenido principal

R parte 3


Vamos ahora con los porcentajes.
Aunque cuando empecé a estudiar las TICs (antes informática) en un tiempo donde la programación orientada a objetos era una curiosidad, no me gusta repetir código y aunque no con métodos y polimorfismo, por medio de funciones y subrutinas tratábamos de optimizar recursos en la era de los procesadores INTEL 8086/8088 donde todo era precario.
Para esta entrega tratando de evitar los ciclos para intercalar, le aplicamos ingeniería al asunto e hicimos nuestra primer función en R la cual le llamamos intercalar().
Antes de eso hablaremos de la función svyratio() que es para realizar operaciones: obtener razones o en si divisiones. Vamos al ejemplo:



Para sacar los porcentajes es necesario usar otra función del paquete survey y como lo menciono arriba es la svyratio(). Para el cálculo del porcentaje de mujeres embarazadas de 15 a 49 años que deseaban embarazarse (cel1_2) es necesario dividirlo por el subuniverso que son las mujeres embarazadas de 15 a 49 años (cel1_1) como se observa en la imagen.


Entonces hacemos la siguiente instrucción.

svyratio(~cel1_2,denominator=~cel1_1,DisenoE)


El resultado es un arreglo de svyratio…


Para multiplicarlo por 100 necesitamos accesar a dicho elemento.

svyratio(~cel1_2,denominator=~cel1_1,DisenoE)[[1]]*100

Para hacer los cortes por grupo de edad es algo similar a svyby() con svytotal(), solo que ahora es svyby() con svyratio(). Ejemplifico con los porcentajes por grupos de edad.


Se puede advertir que ahora accesamos el elemento 2, de este dataframe (resultado de svyby), haciéndolo con su índice 2, [[2]].
Y bueno si quisiéramos arrancar como lo hicimos con los cuadros expandido y muestral lo podemos hacer con la misma lógica, sin embargo todo se puede y debemos mejorarlo, entonces para no repetir los ciclos de intercalación, mejor creamos una función.
Por ahora esta medio “macucha” - chafa – luego si hay tiempo la mejoraremos.Para no entrar en detalles, la abstracción es: se mandan dos arreglos que se quieran intercalar y la posición donde se desea que se intercalen los elementos del segundo arreglo, con la condición de que para que funcione debe ser de iguales dimensiones o factorizados según la posición de intercalación, dicho en otras palabras por ejemplo (dimarreglo2 =6 a dim arreglo1=12 posición a intercalar 3, dimarreglo2=6 a dimarreglo1=18 posición a intercalar 4, dimarreglo1=6 a dimarreglo2=24 posición a intercalar 5) – que por cierto ya se me ocurrió como simplificar la función para la versión 2. Aquí el código:


 Para este cuadro la primera columna es la cifra del cuadro expandido, por lo que creo otra variable llamada:

FE DE ERRATAS: Para este ejemplo el arreglo resultante le llamé c, pero c es una palabra reservada en R, al tener algunas fallas en el código cambié el nombre a este identificador.

ColT <- col1

Entonces les muestro el código de la segunda columna que son porcentajes.



Misma secuencia para la columna2, una vez terminados los cálculos de las 2 columnas se crea el dataframe con los arreglos ColT, col1 y col2.

cuadro5_1 <- data.frame(ColT, col2, col3)

Y podemos revisar las cifras contra el cuadro publicado.




Y pues hasta aquí lo que con REDATAM se hace sin mayores dificultades y con apoyos de asistentes gráficos inclusive, las siguientes partes serán ahora si de las precisiones estadísticas, razón por la cual nos hemos movido a este lenguaje.
Para terminar no tengo idea porque en la columna 2 me salen 2 decimales y en la columna 1 solamente 1, habrá que investigar. Seguiremos con las entregas subsecuentes.
Miguel Araujo

Comentarios

Entradas populares de este blog

Posit Cloud - como instalar librerías de Python en el entorno de R

 Ahora que estamos tomando una maestría buscando que siga "girando la ardilla" por unos años más en la materia de "Cómputo Estadístico" nos ha sugerido usar la versión gratuita de Posit en la nube. En su página definen este producto como "es una solución basada en la nube que permite acceder al poderoso conjunto de herramientas de ciencia de datos de Posit directamente en el navegador web  - sin requerir instalación o configuraciones complejas". Para los usuarios que han utilizado Posit RStudio en primera instancia verán el entorno muy similar a Posit Cloud con algunas pequeñas diferencias, para empezar necesitamos un usuario o contraseña aunque es posible autenticarse usando alguna cuenta existente como es el caso de Google. Con el tiempo y trabajando en desarrollo de software, vamos entendiendo que quizás el nombre queda muy grande a los pequeños ejemplos, pero es muy recomendable el uso de proyectos siempre. A continuación vemos el entorno Posit Clo...

La librería openxlsx

En el Instituto se utiliza como herramienta de trabajo institucional la suite de ofimática MS Office que ofrece un precio asequible aunque lo actual en el mundo del software es el esquema de suscripciones el que casi se ha convertido en el común de las empresas gigantes de las tecnologías de la información. Es por ello que si bien en un principio que se usaban las bibliotecas XLConnectJars   y XLConnect, al tratar de bajarlas e instalarlas se descubrió - en aquel entonces - que estaban obsoletas. Es por ello que se volteo a la que revisaremos superficialmente en este artículo. Lo primero como siempre es descargar la librería openxlsx que se puede hacer desde el mismo Posit RStudio. Vamos a recrear un cuadro existente en el sitio del Instituto que debido a la crisis sanitaria iniciada en 2020 cobra una relevancia muy importante: "Las principales causas de muerte" que de forma anecdótica   fue la primera aplicación en la cual me pidieron que participara, un programa escri...

R 4.5 vs R 4.4.3

Cuando comparto con mis colegas, sobre todo de trabajo que es mi nicho profesional, acerca de porque tener las últimas versiones del software y que replico sobre todo por dos vertientes: mejor desempeño y funcionalidad del software, y la seguridad que pareciera que las empresas de software recomiendan los mismo o algo cercano a esto. Por ejemplo, veamos lo que nos dice Oracle (dueño de Java) acerca de su versión 8 del Java SE.   En la tabla de la página de Oracle podemos observar las fechas en los cuales ya no habrá soporte para ciertas versiones de Java. En este breve artículo veremos en el caso del interprete de R como se desempeña en una versión con respecto a la más reciente. Los puestos de trabajo que se registran por los patrones en el IMSS ha sido una cifra que muestra el avance o retroceso de como se encuentra el empleo en nuestro país, en este caso diremos que en el sector formal. Los microdatos oscilan arriba de los 20 millones y para su procesamiento es necesario o divi...