IT for everyone

 Bueno el título es debido a que nuestro director adjunto nos manifiesta cada vez que puede, sobre la importancia del idioma en inglés para nuestra labor en el Instituto.

Al igual que el inglés, las ahora conocidas como "Tecnologías de la información"  se está y se estará aun más convirtiendo en una competencia de orden transversal en todas las carreras de nivel  técnico y profesional.

Siguiendo con los nuevos campos de conocimiento a tomar en cuenta en las oficinas nacionales de estadística ( y en todos los ámbitos en general) ahora se ve necesaria la introducción de la llamada "Ciencia de datos".

En un libro que estoy leyendo de forma pausada y lenta - esta en inglés - narran como la ciencia de datos aplicada en un modelo, pronostica los vientos que afectan a los vehículos pesados de carga, en las grandes llanuras norteamericanas. Este modelo lo desarrolló  General Electric (GE) en el área de transportación  y Pete McCabe vicepresidente de esta compañía menciona que "Es el tipo de locura que nadie concebía en el pasado, y una sola disciplina o profesión no puede darle solución al problema. Los chicos del software no pueden hacerlo por ellos mismos. Esto es realmente multi-disciplinario" [1]

Lo mismo ocurre en nuestro Instituto somos un ejército de actuarios, matemáticos, estadísticos, demógrafos, geólogos, sociólogos, informáticos y una larga lista de profesiones a los cuales se van a ir incorporando los cotizados científicos de datos.

Volviendo al título del post y al campo de conocimiento en el que me desarrollo preponderadantemente (aunque insisto cada vez somos más multidisciplinarios) durante décadas individuos y organizaciones han buscando convertir la computadora y sus derivados (tabletas, teléfonos inteligentes, etc.) como una "caja negra" y llevarla al límite de la abstracción adicionándole términos coloquiales a las tecnologías de la información tales como "escritorio" y "ventana" para facilitar la interacción hombre - máquina a los usuarios finales, hay toda una disciplina para ello llamada "Arquitectura de la información" (para más información consultar el famoso libro del "Polar Bear" de Rosenfeld & Morville).

Es por ello que herramientas que "acerquen" a nuestro ejército "no informático" a que desarrollen y potencialicen sus habilidades y conocimientos son bienvenidas con beneplácito y pareciera que mientras más dominen dichas herramientas estos profesionales se convierten en un híbrido que dominan su campo de conocimiento y lo maximizan con las TICs (en nuestro México y no se si en latinoamérica se agrega la C de comunicaciones).

Creo que me salgo del molde de mis colegas y por ello no descarto tecnologías que aparentemente parecieran viejas y obsoletas, y muchas veces como profesionales en las TICs no le dedicamos el tiempo ni análisis necesario.

Me atrevo a decir que uno de los mayores casos de éxito en el Instituto son los lenguajes basados en XBase (actualmente Visual FoxPro que Microsoft sacó su última versión en 2004 y la actualizó en 2007) y sus archivos de almacenamiento de datos, los inmortales (aún) archivos dbf.

Lo menciono como caso de éxito porque me tocó conocer a personas (un buen compañero me mencionaba que la Doctora Ana Estela Lozano era una de ellas) sin el perfil informático que desarrollaron y desarrollan desde programas simples hasta sistemas completos para dar soluciones al procesamiento de datos en todas sus fases, sería interesante y buena idea hasta hacer un "paper" respecto a ésto, es decir que desarrollaron la todavía compleja habilidad - arte de la programación.

Y no es un misterio que a pesar de años y años de capacitación en tecnologías web, SQL y lenguajes de alto nivel como C, Java y C#, existe aun en nuestros días un importante nicho de programadores y software escrito en FoxPro y sus derivados, debe ser por algo y yo de manera empírica creo que es la sencillez que da el mismo lenguaje además que incorporó el SQL (con grandes limitaciones en comparación a otros motores de base de datos ) a su propio lenguaje basado en Xbase.

No obstante, hay que decirlo, Microsoft ya cerró su desarrollo de Visual FoxPro, por eso nuestros compañeros han migrado al SPSS de IBM, SAS o STATA. con sus respectivos costos de licenciamiento.

Otra vertiente muy importante en el Instituto es el lenguaje de programación R (muy probablemente el bisnieto o nieto de aquel celebre  FORTRAN) que ha tenido un importante auge de la mano de la ciencia de datos con la cualidad que es software libre y parece ser que el Instituto lo tomará como parte de plataforma de software.

Sin embargo y sin que suene alarmista según un artículo en línea de la revista "Computer hoy" [2] señala que R es uno de los lenguajes que pudiera desaparecer en una década según el índice TIOBE [3], pero vamos creo que ahora da y dará mucho valor a nuestros procesos institucionales como lo he documentado en anteriores artículos.

Vamos ahora con el gran olvidado en los años recientes en nuestro Instituto: REDATAM.

Es bien sabido que tenemos tareas que se han, hacen y se seguirán haciendo como lo son las faenas en el campo de la Estadística Básica, es decir todos necesitamos la frecuencia, calcular universos, el cruce de dos variables o más, la media, la mediana entre otras.

Pues esto y mucho más lo cubre REDATAM de sobra, en mi experiencia (con el único que no he trabajado es con SAS) su lenguaje de programación esta a la altura en lo elemental al que tiene SPSS y STATA, y que dicho sea de paso a muchos investigadores (según una charla con algunos del  Instituto Nacional de Salud Pública) programan código en éstos últimos por lo que en dado caso de migrar a REDATAM no les sería complicado.

¿Entonces porque se dejó de usar en México?

En una charla con mi compañero y amigo Jorge Mata, el punto neurálgico es la creación de la base de datos REDATAM, casi nadie lo sabe y/o investiga. Sin duda esta labor la debe llevar un informático preferentemente, sin embargo volvemos a lo mismo, estamos bien enfrascados en el PLSQL, Transact-SQL, bases de datos NO-SQL y lenguajes de programación web y móvil, que no queremos o no podemos construir una base de datos de REDATAM y en muchos casos menospreciamos la herramienta.



Huelga decir, que debido a que el software de REDATAM esta en constante desarrollo tiene algunos "bugs" que pudieran desalentar a los incipientes neófitos de la herramienta.

Por lo que considero, es necesario capacitar a nuevos compañeros para la creación de bases de datos, ya que una vez construida, los compañeros - que hay muchos por ahí escondidos - que saben usar el módulo Red7 Process, pueden desde sacar sencillas frecuencias hasta cuadros de información como los de diario que hacemos en cada encuesta, registro administrativo o censo, además que se puede graficar, georreferenciar y hasta hacer sitios web para consulta de información, todo esto sin ningún costo de licenciamiento.

Con lo anterior no quiero decir que todo lo podemos hacer con REDATAM - supongo que tiene sus límites y no he estado en constante contacto y actualización del software - sino que aquellos que solo quieren hacer las tareas rutinarias y básicas de nuestro quehacer estadístico, lo usen y gasten su talento en la interpretación de los resultados o cualquiera que sea su campo de aplicación.

Y para aquellos que hacen o estamos por hacer análisis más profundos usemos R, SQL y Python para las tareas complejas y especializadas.

Por lo que si tenemos bases de datos que todos o casi todos nuestros compañeros las usan sin problema utilizando el módulo Red7 Process o una aplicación web de WebServer tendríamos la informática para todos (IT for everyone) coadyuvando a la cultura estadística organizacional.

Hasta aquí mi opinión y les seguiré compartiendo artículos de nuestra dualidad permanente Informática - Estadística (IT & Statistics).

Saludos.

Miguel Araujo.

Referencias

[1] J. Aoun, Robot Proof: Higher Education in the Age of Artificial Intelligence, 1st ed. London, England: MIT Press, 2017, p. 36.

[2] "ComputerHoy.com: Todo sobre tecnología, gadgets y novedades", Computerhoy.com, 2021. [Online]. Available: https://computerhoy.com/noticias/tecnologia/5-lenguajes-programacion-condenados-morir-menos-decada-575417. [Accessed: 26- Apr- 2021].

[3]"index | TIOBE - The Software Quality Company", Tiobe.com, 2021. [Online]. Available: https://www.tiobe.com/tiobe-index/. [Accessed: 26- Apr- 2021].

Comentarios

Publicar un comentario

Entradas populares de este blog

Librería de REDATAM para R

Conectar bases de datos Oracle con R vía JDBC

Red 7 Admin