REDATAM saca el pecho con su versión X
El jueves publiqué el artículo referente a los tiempos de las herramientas informáticas para la explotación de datos donde se concluye que con una computadora con más poder de procesamiento R usando Spark es quien obtuvo el menor tiempo para el cruce en este estudio. El viernes santo recibí un correo electrónico de Lenin Aguinaga donde aparte de darme su opinión sobre la comparación en cuestión, nos compartía una primicia, un regalo de pascuas.
La verdad me he sentido muy halagado y honrado ante tal gentileza de nuestro amigo de Chile, ya que esta versión aun no se ha dado la luz en los sitios oficiales de la CEPAL/CELADE.
Así que el día de hoy sin más preámbulos me puse a instalar esta nueva versión alfa de REDATAM X donde después de algunos tumbos que me ayudó a resolver Lenin, hicimos la prueba del mismo cruce quedando nuevamente sorprendido de la velocidad de nuestra querida herramienta. ¡¡22 segundos!!
Reitero que el lenguaje R es nuestra herramienta por excelencia y tiene un sin fin de funcionalidades, sin embargo el hecho de investigar herramientas alternativas es porque no todos los usuarios de los institutos de estadística nacionales tienen formación orientada a la programación o áreas de conocimiento afines; es por ello que herramientas como REDATAM les pueden dar soluciones a demandas de información cotidianas.
Sin embargo percibo que en nuestro país hemos dejado de lado este software y se ha optado por soluciones comerciales tales como SPSS, STATA, SAS por mencionar algunas y no nos hemos dado a la tarea de seguir generando bases de datos para consulta de la mayoría de nuestros usuarios.
Por tal motivo actualizando mi lista de contactos relacionados con REDATAM - muchas personas que trabajaban y se interesaban ya no están en el Instituto - y a los cuales les comparto mis artículos hoy se ha reducido a 2 personas sintiéndome algo así como que somos los últimos Jedis 😀👽.
Por último y concluyendo; ante tales resultados de desempeño, facilidad de uso, cero costos de licenciamiento y un conjunto de potencialidades que no les he mostrado y en algunos casos aun no conozco o no he explorado, me salta el siguiente cuestionamiento: ¿no valdrá la pena volver la vista a REDATAM?
Dejo por último la tabla comparativa que llenará de orgullo a Lenin y a su equipo.
Estadística: Puestos de trabajo registrados ante el IMSS 2016.
Consulta: Cruce de mes de registro del puesto de trabajo contra sexo de la persona que ocupa el puesto de trabajo.
Número de registros o tuplas: 220, 816,117
Equipo donde se ejecutaron los procesos:
Procesador: Intel CORE i5 a 3.5 GHz
Memoria RAM: 16GB
Software |
Entorno
de ejecución |
Duración
del proceso |
Redatam X Alpha |
Standalone |
22 segundos |
R con Spark |
Standalone |
60 segundos |
Redatam +SP V5 |
Standalone | 66 segundos |
Redatam 7 |
Standalone |
77 segundos |
Oracle 12c |
Acceso VPN ejecución en el Instituto |
96 segundos |
Seguimos leyéndonos.
Atte.
Miguel Araujo.
Comentarios
Publicar un comentario