Entradas

Mostrando entradas de 2019

STATA algo nuevo que aprender (3)

Imagen
Sigo en ascuas, pero eso ayuda a que podamos enfocarnos y aplicarnos aun más. En el área de las escuestas en los hogares se necesita expandir las casos con un factor de expansión, para ello en el manual en inglés no lo encontré en la página que voy, busque en internet y la vista me falló y confundí un corchete con un paréntesis, entonces utilice las ayudas vía menus y formularios y fue como lo pudimos resolver. En nuestro país hay toda una discusión sobre la pobreza ya que unos la quieren ocultar, otros la desconocen y se unen a los que la quieren ocultar, y el resto quiere visualizarla para implementar políticas públicas para combatirla aunque esto conlleva grandes retos e inclusive luchas entre los diferentes sectores de poder, políticos, empresariales y sociales. Esta base de datos muestra cosas muy interesantes que se vieron envueltas de polémica entre el INEGI y CONEVAL aunque al final se lograron concensos entre los 2 institutos autónomos. Con valores muestrales lo primero qu

STATA algo nuevo que aprender (2)

Imagen
Debido a que parecer ser que es muy complicado encontrar el archivo hh.dat, pues nosotros tenemos también mediciones acerca de la pobreza, por lo cual descargamos archivos del CONEVAL ( liga de la página ) referentes a la Encuesta Nacional de Ingresos y Gastos en los Hogares (ENIGH) 2016 que levanta el Instituto. Vamos a usar el archivo pobreza_16.dta . La siguiente instrucción es tab(ulate) en el texto se habla de una variable región , nosotros nos vamos con una variable geográfica llamada ubica_geo .

STATA algo nuevo que aprender

Imagen
En la vida a veces aparecen oportunidades y sin hacer aspavientos o cantar victoria anticipadamente me encuentro con una posibilidad de lograr una mejor posición laboral dentro del Instituto y para ello entre la bibliografía nos solicitan estudiar de un documento publicado por el Instituto de Estadística para las Naciones Unidas para la Región de Asia y el Pacífico, que practicamente es una introducción a este paquete estadístico. STATA al igual que SPSS y SAS son programas de paga, pero que actualmente cobran relevancia gracias a la tan sonada materia de la "Ciencia de los datos". Como un consejo y sabiendo que casi todas las compañías ofrecen evaluaciones de su software pues yo me fui a la página de STATA y solicité una copia de evaluación. Copia para evaluación Hay que registrar los datos por medio de un formulario y yo recomiendo que usen sus correos del Instituto o bien de una Institución académica aunque creo que si no lo hacen también recibirán una copia para evalu

R parte 4

Imagen
Ahora viene lo bueno y otra vez entramos a terrenos que dominan más los matemáticos-estadísticos, aunque de hecho el cálculo pues no es más que usar otra función del paquete survey y ya. En la página del INEGI hay un artículo llamado “ Una aproximación metodológica al uso de datos de encuestas en hogares ” escrito por el ex-compañero Julio Cesar Martínez Sánchez, donde menciona de forma llana y sencilla una definición de estas mediciones. “ ... existen algunas medidas de dispersión que son útiles para evaluar la calidad de un dato que se genera a partir de una encuesta compleja. Dentro de éstas se encuentran los errores estándar y de muestreo, el intervalo de confianza y el coeficiente de variación (Carsey, 2014; EUSTAT, 1998; Steven, 1999; Naciones Unidas, 2009; Wolter, 2009). Esta última es de gran importancia, pues refleja la magnitud relativa que tiene dicho error estándar con respecto al estimador de referencia, y entre más pequeño sea este valor, mejor es la precisión. S

R parte 3

Imagen
Vamos ahora con los porcentajes. Aunque cuando empecé a estudiar las TICs (antes informática) en un tiempo donde la programación orientada a objetos era una curiosidad, no me gusta repetir código y aunque no con métodos y polimorfismo, por medio de funciones y subrutinas tratábamos de optimizar recursos en la era de los procesadores INTEL 8086/8088 donde todo era precario. Para esta entrega tratando de evitar los ciclos para intercalar, le aplicamos ingeniería al asunto e hicimos nuestra primer función en R la cual le llamamos intercalar(). Antes de eso hablaremos de la función svyratio() que es para realizar operaciones: obtener razones o en si divisiones. Vamos al ejemplo: Para sacar los porcentajes es necesario usar otra función del paquete survey y como lo menciono arriba es la svyratio(). Para el cálculo del porcentaje de mujeres embarazadas de 15 a 49 años que deseaban embarazarse (cel1_2) es necesario dividirlo por el subuniverso que son las mujeres embarazad

R parte 2

Imagen
En la parte 1 vimos como obtener de manera separada ciertos cálculos para armar un cuadro, ahora entra la parte del programador de la vieja escuela, resolver como se pueda – en aquellos ya muy lejanos años en el CETis 155 cuando se nos hacían observaciones a nuestro código (Basic, Pascal o Cobol) nuestra defensa era “pero jala, ¿no?”. Lo que leí de R es que ya es un lenguaje multiparadigma por lo que entiendo que se pueden hacer clases o mínimo funciones, por ahora resolví de la primera forma que intuí, de hecho no uso cruce de 3 variables pues el bendito copy - paste me permitio sacar las cifras de la parte expandida del cuadro (o como lo llaman nuestros compañeros las estimaciones puntuales). Empezamos pues, la estrategía es que los resultados parciales (o tijereteados) se guarden en arreglos de una dimensión -vectores- para después meterlos en un dataframe según ejemplo observado en la página de la Universidad de las Palmas de la Gran Canaria . Lo que sigue es lógica de

R 1a Parte

Imagen
En nuestro Instituto durante años se ha utilizado diversas herramientas para el procesamiento de información de acuerdo a las necesidades y también al expertise del personal. En tiempos de austeridad republicana las herramientas de software libre sin duda tomarán más importancia en las áreas de estadística del Instituto y si agregamos que cuentan con la venía de nuestro emperador hemos empezado a transitar por este camino. En su sitio oficial  se define como "R es un software gratuito para cómputo estadístico y gráficos. Compila y se ejecuta en múltiples plataformas de UNIX, Windows y MacOS". Llevo un par de cursos referentes a este lenguaje de programación que de hecho en la clasificación de los lenguajes en un principio era catalogado como funcional, ahora si revisamos Wikipedia aparece como multi-paradigma, aunque los principios de programación son los mismos tiene características muy especiales que intuyo vienen del calculo vectorial.