Ir al contenido principal

IT for everyone

 Bueno el título es debido a que nuestro director adjunto nos manifiesta cada vez que puede, sobre la importancia del idioma en inglés para nuestra labor en el Instituto.

Al igual que el inglés, las ahora conocidas como "Tecnologías de la información"  se está y se estará aun más convirtiendo en una competencia de orden transversal en todas las carreras de nivel  técnico y profesional.

Siguiendo con los nuevos campos de conocimiento a tomar en cuenta en las oficinas nacionales de estadística ( y en todos los ámbitos en general) ahora se ve necesaria la introducción de la llamada "Ciencia de datos".

En un libro que estoy leyendo de forma pausada y lenta - esta en inglés - narran como la ciencia de datos aplicada en un modelo, pronostica los vientos que afectan a los vehículos pesados de carga, en las grandes llanuras norteamericanas. Este modelo lo desarrolló  General Electric (GE) en el área de transportación  y Pete McCabe vicepresidente de esta compañía menciona que "Es el tipo de locura que nadie concebía en el pasado, y una sola disciplina o profesión no puede darle solución al problema. Los chicos del software no pueden hacerlo por ellos mismos. Esto es realmente multi-disciplinario" [1]

Lo mismo ocurre en nuestro Instituto somos un ejército de actuarios, matemáticos, estadísticos, demógrafos, geólogos, sociólogos, informáticos y una larga lista de profesiones a los cuales se van a ir incorporando los cotizados científicos de datos.

Volviendo al título del post y al campo de conocimiento en el que me desarrollo preponderadantemente (aunque insisto cada vez somos más multidisciplinarios) durante décadas individuos y organizaciones han buscando convertir la computadora y sus derivados (tabletas, teléfonos inteligentes, etc.) como una "caja negra" y llevarla al límite de la abstracción adicionándole términos coloquiales a las tecnologías de la información tales como "escritorio" y "ventana" para facilitar la interacción hombre - máquina a los usuarios finales, hay toda una disciplina para ello llamada "Arquitectura de la información" (para más información consultar el famoso libro del "Polar Bear" de Rosenfeld & Morville).

Es por ello que herramientas que "acerquen" a nuestro ejército "no informático" a que desarrollen y potencialicen sus habilidades y conocimientos son bienvenidas con beneplácito y pareciera que mientras más dominen dichas herramientas estos profesionales se convierten en un híbrido que dominan su campo de conocimiento y lo maximizan con las TICs (en nuestro México y no se si en latinoamérica se agrega la C de comunicaciones).

Creo que me salgo del molde de mis colegas y por ello no descarto tecnologías que aparentemente parecieran viejas y obsoletas, y muchas veces como profesionales en las TICs no le dedicamos el tiempo ni análisis necesario.

Me atrevo a decir que uno de los mayores casos de éxito en el Instituto son los lenguajes basados en XBase (actualmente Visual FoxPro que Microsoft sacó su última versión en 2004 y la actualizó en 2007) y sus archivos de almacenamiento de datos, los inmortales (aún) archivos dbf.

Lo menciono como caso de éxito porque me tocó conocer a personas (un buen compañero me mencionaba que la Doctora Ana Estela Lozano era una de ellas) sin el perfil informático que desarrollaron y desarrollan desde programas simples hasta sistemas completos para dar soluciones al procesamiento de datos en todas sus fases, sería interesante y buena idea hasta hacer un "paper" respecto a ésto, es decir que desarrollaron la todavía compleja habilidad - arte de la programación.

Y no es un misterio que a pesar de años y años de capacitación en tecnologías web, SQL y lenguajes de alto nivel como C, Java y C#, existe aun en nuestros días un importante nicho de programadores y software escrito en FoxPro y sus derivados, debe ser por algo y yo de manera empírica creo que es la sencillez que da el mismo lenguaje además que incorporó el SQL (con grandes limitaciones en comparación a otros motores de base de datos ) a su propio lenguaje basado en Xbase.

No obstante, hay que decirlo, Microsoft ya cerró su desarrollo de Visual FoxPro, por eso nuestros compañeros han migrado al SPSS de IBM, SAS o STATA. con sus respectivos costos de licenciamiento.

Otra vertiente muy importante en el Instituto es el lenguaje de programación R (muy probablemente el bisnieto o nieto de aquel celebre  FORTRAN) que ha tenido un importante auge de la mano de la ciencia de datos con la cualidad que es software libre y parece ser que el Instituto lo tomará como parte de plataforma de software.

Sin embargo y sin que suene alarmista según un artículo en línea de la revista "Computer hoy" [2] señala que R es uno de los lenguajes que pudiera desaparecer en una década según el índice TIOBE [3], pero vamos creo que ahora da y dará mucho valor a nuestros procesos institucionales como lo he documentado en anteriores artículos.

Vamos ahora con el gran olvidado en los años recientes en nuestro Instituto: REDATAM.

Es bien sabido que tenemos tareas que se han, hacen y se seguirán haciendo como lo son las faenas en el campo de la Estadística Básica, es decir todos necesitamos la frecuencia, calcular universos, el cruce de dos variables o más, la media, la mediana entre otras.

Pues esto y mucho más lo cubre REDATAM de sobra, en mi experiencia (con el único que no he trabajado es con SAS) su lenguaje de programación esta a la altura en lo elemental al que tiene SPSS y STATA, y que dicho sea de paso a muchos investigadores (según una charla con algunos del  Instituto Nacional de Salud Pública) programan código en éstos últimos por lo que en dado caso de migrar a REDATAM no les sería complicado.

¿Entonces porque se dejó de usar en México?

En una charla con mi compañero y amigo Jorge Mata, el punto neurálgico es la creación de la base de datos REDATAM, casi nadie lo sabe y/o investiga. Sin duda esta labor la debe llevar un informático preferentemente, sin embargo volvemos a lo mismo, estamos bien enfrascados en el PLSQL, Transact-SQL, bases de datos NO-SQL y lenguajes de programación web y móvil, que no queremos o no podemos construir una base de datos de REDATAM y en muchos casos menospreciamos la herramienta.



Huelga decir, que debido a que el software de REDATAM esta en constante desarrollo tiene algunos "bugs" que pudieran desalentar a los incipientes neófitos de la herramienta.

Por lo que considero, es necesario capacitar a nuevos compañeros para la creación de bases de datos, ya que una vez construida, los compañeros - que hay muchos por ahí escondidos - que saben usar el módulo Red7 Process, pueden desde sacar sencillas frecuencias hasta cuadros de información como los de diario que hacemos en cada encuesta, registro administrativo o censo, además que se puede graficar, georreferenciar y hasta hacer sitios web para consulta de información, todo esto sin ningún costo de licenciamiento.

Con lo anterior no quiero decir que todo lo podemos hacer con REDATAM - supongo que tiene sus límites y no he estado en constante contacto y actualización del software - sino que aquellos que solo quieren hacer las tareas rutinarias y básicas de nuestro quehacer estadístico, lo usen y gasten su talento en la interpretación de los resultados o cualquiera que sea su campo de aplicación.

Y para aquellos que hacen o estamos por hacer análisis más profundos usemos R, SQL y Python para las tareas complejas y especializadas.

Por lo que si tenemos bases de datos que todos o casi todos nuestros compañeros las usan sin problema utilizando el módulo Red7 Process o una aplicación web de WebServer tendríamos la informática para todos (IT for everyone) coadyuvando a la cultura estadística organizacional.

Hasta aquí mi opinión y les seguiré compartiendo artículos de nuestra dualidad permanente Informática - Estadística (IT & Statistics).

Saludos.

Miguel Araujo.

Referencias

[1] J. Aoun, Robot Proof: Higher Education in the Age of Artificial Intelligence, 1st ed. London, England: MIT Press, 2017, p. 36.

[2] "ComputerHoy.com: Todo sobre tecnología, gadgets y novedades", Computerhoy.com, 2021. [Online]. Available: https://computerhoy.com/noticias/tecnologia/5-lenguajes-programacion-condenados-morir-menos-decada-575417. [Accessed: 26- Apr- 2021].

[3]"index | TIOBE - The Software Quality Company", Tiobe.com, 2021. [Online]. Available: https://www.tiobe.com/tiobe-index/. [Accessed: 26- Apr- 2021].

Comentarios

Publicar un comentario

Entradas populares de este blog

Posit Cloud - como instalar librerías de Python en el entorno de R

 Ahora que estamos tomando una maestría buscando que siga "girando la ardilla" por unos años más en la materia de "Cómputo Estadístico" nos ha sugerido usar la versión gratuita de Posit en la nube. En su página definen este producto como "es una solución basada en la nube que permite acceder al poderoso conjunto de herramientas de ciencia de datos de Posit directamente en el navegador web  - sin requerir instalación o configuraciones complejas". Para los usuarios que han utilizado Posit RStudio en primera instancia verán el entorno muy similar a Posit Cloud con algunas pequeñas diferencias, para empezar necesitamos un usuario o contraseña aunque es posible autenticarse usando alguna cuenta existente como es el caso de Google. Con el tiempo y trabajando en desarrollo de software, vamos entendiendo que quizás el nombre queda muy grande a los pequeños ejemplos, pero es muy recomendable el uso de proyectos siempre. A continuación vemos el entorno Posit Clo...

La librería openxlsx

En el Instituto se utiliza como herramienta de trabajo institucional la suite de ofimática MS Office que ofrece un precio asequible aunque lo actual en el mundo del software es el esquema de suscripciones el que casi se ha convertido en el común de las empresas gigantes de las tecnologías de la información. Es por ello que si bien en un principio que se usaban las bibliotecas XLConnectJars   y XLConnect, al tratar de bajarlas e instalarlas se descubrió - en aquel entonces - que estaban obsoletas. Es por ello que se volteo a la que revisaremos superficialmente en este artículo. Lo primero como siempre es descargar la librería openxlsx que se puede hacer desde el mismo Posit RStudio. Vamos a recrear un cuadro existente en el sitio del Instituto que debido a la crisis sanitaria iniciada en 2020 cobra una relevancia muy importante: "Las principales causas de muerte" que de forma anecdótica   fue la primera aplicación en la cual me pidieron que participara, un programa escri...

R 4.5 vs R 4.4.3

Cuando comparto con mis colegas, sobre todo de trabajo que es mi nicho profesional, acerca de porque tener las últimas versiones del software y que replico sobre todo por dos vertientes: mejor desempeño y funcionalidad del software, y la seguridad que pareciera que las empresas de software recomiendan los mismo o algo cercano a esto. Por ejemplo, veamos lo que nos dice Oracle (dueño de Java) acerca de su versión 8 del Java SE.   En la tabla de la página de Oracle podemos observar las fechas en los cuales ya no habrá soporte para ciertas versiones de Java. En este breve artículo veremos en el caso del interprete de R como se desempeña en una versión con respecto a la más reciente. Los puestos de trabajo que se registran por los patrones en el IMSS ha sido una cifra que muestra el avance o retroceso de como se encuentra el empleo en nuestro país, en este caso diremos que en el sector formal. Los microdatos oscilan arriba de los 20 millones y para su procesamiento es necesario o divi...