Redatam multiplataforma para pruebas.

 Pues inicia un nuevo año y pues con novedades de nuevos cierres por la pandemia aunque con la ligera esperanza de que se menos letal que en los tiempos recientes.

Casi a finales del año el Instituto adquirió equipo de cómputo para usos geográficos con lo cual se desocuparon equipos Intel Core i7 de los que nuestra área fue beneficiada.

Por lo cual me di a la tarea de volver a hacer las pruebas ya solo en modo local, es decir las tres versiones de REDATAM y R con Spark.

Tuve algunos problemas con Spark y es que baje un JRE que parece no ser compatible con Spark porque lo que el consejo es que tomemos el de la página oficial de Oracle y con ello ya pude hacer la prueba.

En el tiempo que no podía correr Spark con R, me fui a instalar nuevamente la versión que el compañero Lenin Aguinaga me compartió, pero al momento de hacer la consulta, el sistema abortaba.

Debido a esto, fui a descargar las versiones de REDATAM disponibles con la grata sorpresa que los compañeros de la CEPAL ya publicaron las primeras versiones de prueba de REDATAM que por ahora no le han agregado la X en su página de descarga y solo le llaman multiplataforma.

https://redatam.org/es/aplicaciones



 Procedí a la instalación (versión 2.0Beta) y con grata sorpresa el cruce funcionó sin problemas.


 Inclusive la salida sale más formateada a la última prueba que se realizó.


Entonces sin más preámbulos comparto el resultado de este nuevo Bechmark con mi nuevo desktop del trabajo.

Estadística: Puestos de trabajo registrados ante el IMSS 2016.

Consulta: Cruce de mes de registro del puesto de trabajo contra sexo de la persona que ocupa el puesto de trabajo.

Número de registros o tuplas: 220, 816,117

Equipo donde se ejecutaron los procesos:

Marca y Modelo: DELL Optiplex 9020

Procesador: Intel CORE i7 a 3.6 GHz

Memoria RAM: 16GB


Software

Entorno de ejecución

Duración del proceso

Redatam 2.0 Beta

Standalone

15 segundos

R con Spark

Standalone

41 segundos

Redatam +SP V5

Standalone

66 segundos

Redatam 7

Standalone

77 segundos


Podemos observar que en el caso de las 2 versiones anteriores de REDATAM no tuvieron cambios pero en el caso del nuevo y R con Spark el cruce se realizó más rápido.

Por ahora vamos a seguir haciendo pruebas con el nuevo REDATAM y quizás moviendo la configuración de R con Spark pero seguimos teniendo muy buena velocidad de ejecución.

Concluyo deseando que tengan un excelente año 2022 lleno de éxitos y muy especialmente de salud.

Atte.

Miguel Araujo.



Comentarios

Entradas populares de este blog

Librería de REDATAM para R

Conectar bases de datos Oracle con R vía JDBC

Red 7 Admin