Ir al contenido principal

STATA algo nuevo que aprender

En la vida a veces aparecen oportunidades y sin hacer aspavientos o cantar victoria anticipadamente me encuentro con una posibilidad de lograr una mejor posición laboral dentro del Instituto y para ello entre la bibliografía nos solicitan estudiar de un documento publicado por el Instituto de Estadística para las Naciones Unidas para la Región de Asia y el Pacífico, que practicamente es una introducción a este paquete estadístico.
STATA al igual que SPSS y SAS son programas de paga, pero que actualmente cobran relevancia gracias a la tan sonada materia de la "Ciencia de los datos".
Como un consejo y sabiendo que casi todas las compañías ofrecen evaluaciones de su software pues yo me fui a la página de STATA y solicité una copia de evaluación.
Copia para evaluación
Hay que registrar los datos por medio de un formulario y yo recomiendo que usen sus correos del Instituto o bien de una Institución académica aunque creo que si no lo hacen también recibirán una copia para evaluar el software.
En mi caso di el correo electrónico de la Universidad y en un par de horas me llegó un correo con un PDF donde vienen datos para instalar la versión de prueba asi como un usuario y contraseña para descargar el sofware.


La instalación se realiza sin novedad y es muy importante leer el PDF que viene en el correo que recibe uno de STATA.
También nos redirige a una página donde registramos nuestra prueba de evaluación, yo lo hice aunque no supe si es necesario para usar el software.
Lo buscamos en nuestras aplicaciones de Windows y lo ejecutamos.
Para empezar nos pone un ejemplo de un estudio de pobreza en Bangladesh realizado por el banco mundial, lo busque en la web y me encontré que el banco mundial ya tiene un módulo  para explotar y gracias a este link ejecuté mi primera instrucción en STATA que es para instalar el módulo de acceso para descargar información del banco, el comando que ejecuté fue:
ssc install wboopendata
En pocos minutos el módulo se había instalado.

Un gran problema que veo cuando se usan este tipo de aplicaciones es que no conocemos los datos por lo que resulta complicado la explotación de estos.
Para tratar de apegarnos al texto busqué sin éxito el archivo hh.dta, entonces me fui a buscar otras fuentes, y entre ellas me fui al CONEVAL para descargar archivos del 2010 en formato STATA, por lo que descargué y copié en la unidad D de la computadora.
Y empece con la guía de uso que principalmente se basa en la ventana de Comando.
1 Primero use el comando cd para cambiar de directorio
2 Elijo para trabajar el archivo poblacion
3 Cuento cuantos registros (observaciones) hay en el archivo
4 Hago un conteo con las observaciones que hay de acuerdo la condición edad mayor a 30.

Podemos seguir explorando STATA con los ejemplos del manual.

5. Describe
Aquí una descripción del archivo en formato STATA, es como nuestro famoso FD ancestral.
Y por último tenemos ...
6 Summarize que nos brinda la media, desviación estándar, el mínimo y el máximo de cada variable siempre y cuando sea númerica .
Seguiremos con más de STATA, en siguientes entregas.

Miguel Araujo

Comentarios

Entradas populares de este blog

Posit Cloud - como instalar librerías de Python en el entorno de R

 Ahora que estamos tomando una maestría buscando que siga "girando la ardilla" por unos años más en la materia de "Cómputo Estadístico" nos ha sugerido usar la versión gratuita de Posit en la nube. En su página definen este producto como "es una solución basada en la nube que permite acceder al poderoso conjunto de herramientas de ciencia de datos de Posit directamente en el navegador web  - sin requerir instalación o configuraciones complejas". Para los usuarios que han utilizado Posit RStudio en primera instancia verán el entorno muy similar a Posit Cloud con algunas pequeñas diferencias, para empezar necesitamos un usuario o contraseña aunque es posible autenticarse usando alguna cuenta existente como es el caso de Google. Con el tiempo y trabajando en desarrollo de software, vamos entendiendo que quizás el nombre queda muy grande a los pequeños ejemplos, pero es muy recomendable el uso de proyectos siempre. A continuación vemos el entorno Posit Clo...

La librería openxlsx

En el Instituto se utiliza como herramienta de trabajo institucional la suite de ofimática MS Office que ofrece un precio asequible aunque lo actual en el mundo del software es el esquema de suscripciones el que casi se ha convertido en el común de las empresas gigantes de las tecnologías de la información. Es por ello que si bien en un principio que se usaban las bibliotecas XLConnectJars   y XLConnect, al tratar de bajarlas e instalarlas se descubrió - en aquel entonces - que estaban obsoletas. Es por ello que se volteo a la que revisaremos superficialmente en este artículo. Lo primero como siempre es descargar la librería openxlsx que se puede hacer desde el mismo Posit RStudio. Vamos a recrear un cuadro existente en el sitio del Instituto que debido a la crisis sanitaria iniciada en 2020 cobra una relevancia muy importante: "Las principales causas de muerte" que de forma anecdótica   fue la primera aplicación en la cual me pidieron que participara, un programa escri...

R 4.5 vs R 4.4.3

Cuando comparto con mis colegas, sobre todo de trabajo que es mi nicho profesional, acerca de porque tener las últimas versiones del software y que replico sobre todo por dos vertientes: mejor desempeño y funcionalidad del software, y la seguridad que pareciera que las empresas de software recomiendan los mismo o algo cercano a esto. Por ejemplo, veamos lo que nos dice Oracle (dueño de Java) acerca de su versión 8 del Java SE.   En la tabla de la página de Oracle podemos observar las fechas en los cuales ya no habrá soporte para ciertas versiones de Java. En este breve artículo veremos en el caso del interprete de R como se desempeña en una versión con respecto a la más reciente. Los puestos de trabajo que se registran por los patrones en el IMSS ha sido una cifra que muestra el avance o retroceso de como se encuentra el empleo en nuestro país, en este caso diremos que en el sector formal. Los microdatos oscilan arriba de los 20 millones y para su procesamiento es necesario o divi...