Labs

Big Data desde la escuela, ¿sí o no? Qué dicen los expertos sobre esta habilidad que da sueldos de $ 120.000

El futuro viene lleno de datos. Data Literacy es el nombre del juego: no solo recopilarlos sino entenderlos. Ahora también ejecutivos y académicos se ponen a tono para no quedar afuera.

Por Sebastián De Toma - 19 de Octubre 2020
Big Data desde la escuela, ¿sí o no? Qué dicen los expertos sobre esta habilidad que da sueldos de $ 120.000

Recopilar datos no es lo mismo que entenderlos. Lo primero lo puede hacer casi cualquiera; lo segundo, no tanto. Entonces, como dicen los especialistas, hay que “hablar en datos”; es decir, tener la capacidad de leer, escribir y comunicar datos en contexto, incluida la comprensión de las fuentes y construcciones de datos, los métodos analíticos y las técnicas aplicadas, y la capacidad de describir la aplicación del caso de uso y el valor resultante, según define la consultora Gartner a la alfabetización de datos, ya que de eso hablamos, y a lo que se conoce también como Data Literacy.

En una época en la que las organizaciones dejan atrás paulatinamente los modelos predictivos más básicos para pasar a algoritmos más robustos para así obtener conocimiento del negocio que realizan, sea cual fuere. Y en este sentido, la alfabetización en datos de la fuerza laboral es central para que puedan realizar inferencias a partir de una serie de datos. Esto incluye tanto conocer las distintas características de los datos como la elección de la herramienta exacta para analizarlos. “Todos deben ser capaces de saber dónde adquirir los datos, cómo analizarlos y cómo obtener resultados procesables”, marca Rayhaan Rasheed, un consultor de datos en un informe que escribió en la plataforma Medium.

Luego desarrolla: este requisito no es solo para los empleados de nivel inicial, sino que debería ser un estándar en toda la escala corporativa; que los gerentes, directores y ejecutivos aprendan a “hablar en datos”. Hoy, es parte de la cultura de las organizaciones decidir en base a datos, plantea Juan Vidaguren, decano de la Escuela de Gestión del Instituto Tecnológico de Buenos Aires (ITBA).

Sin embargo, una investigación del Data Literacy Project, lanzado por Qlik (una compañía dedicada a data analytics) reveló que solo el 21 por ciento de los empleados está alfabetizados en datos aunque el 65 por ciento afirma que necesitan leer e interpretar los datos con regularidad. Es más: solo el 25 por ciento de los empleados se sintió totalmente preparado para analizar los datos de manera efectiva, al menos cuando comenzaron a trabajar en una posición que los utiliza.

Fredi David Vivas es ingeniero en Sistemas de Información y se especializó en Big Data y confundó RockingData en 2017. Esta compañía realiza consultoría en servicios de Data Science y Big Data. Él dice que ve a la alfabetización en datos “como saber leer y escribir”. ¿Tanto así? Sí. Además, aumenta la “empleabilidad” de aquellas personas con perfiles más o menos técnicos.

“Es una nueva alfabetización a la que veo como una segunda o tercera lengua en un mercado en el que faltan recursos capacitados”, dice, para luego recordar que hace ya siete años, un estudio del Harvard Business Review pronosticó que el mercado laboral padecería la falta de profesionales vinculados a la analítica de datos. Y en jun mercado laboral con escasez de talento, estos conocimientos se pagan cada vez más: de acuerdo a la plataforma de comparación de sueldos Glassdoor, en la Argentina, un científico de datos senior cobra más de $119.000 por mes.

Walter Sosa Escudero

Pero lo más importante de la alfabetización digital no pasa por lo estrictamente instrumental, al menos para Vivas. “No se trata solo de lo laboral sino de convertirse de un mejor ciudadano digital; más allá de saber programar o no, hay que incorporar el pensamiento analítico para entender hasta de fake news”, dice. 

En este sentido contextual, el especialista en Econometría Walter Sosa Escudero apunta que, por ejemplo, un gerente de Tecnología necesita conocer lo suficiente para decidir si va a programar directamente algo relacionado a datos o es mejor contratar a alguien para que lo haga. “Hace falta capacitación para ‘oler’ qué se puede resolver con datos. Tenes que aprender a programar, aunque sea un poquito, para entender la lógica de lo que te quieren vender”, marca. “Hay que decidir de qué lado del mostrador se quiere estar, si quiero que me contraten para usar algoritmos o quiero contratar a alguien que lo haga.”

Trabajar con datos

La empresa más exitosa del país es, por su valor bursátil, MercadoLibre: en los primeros días de julio, la capitalización de mercado de la compañía dedicada al e-Commerce y las finanzas arañó los US$ 50.000 millones. Esto superaba, entonces, en un 13 por ciento a la totalidad de las reservas del Banco Central y era el 75 por ciento de la deuda total que busca reestructurar el gobierno argentino.

Una de las razones de su éxito es su habilidad para trabajar efectivamente con datos, dándole un amplio margen a quienes se dedican a ello dentro de la compañía. Por ejemplo, el sector que construye productos de Machine Learning dentro del área de data regional le da servicios a todos los países de América latina en donde Mercado Libre opera (sus principales operaciones están en la Argentina, México y Brasil) y a todas sus unidades de negocio (Mercado Libre, Mercado Pago, Mercado Envios, Mercado Créditos, Mercado Publicidad y Mercado Shops), dado que todas usan datos.

Así lo cuenta Fernando Croceri, gerente de Analítica y Data Science en la firma. Trabajan, cuenta, en los carruseles de recomendaciones de QR dentro de la app Mercado Pago, cómo detectar comportamientos indebidos dentro del sitio, cómo ordenar ítems de una landing hasta la construcción de de herramientas tecnológicas que ayuden a otros equipos a desarrollar e incorporar Machine Learning dentro de cada producto.

“A veces utilizamos Machine Learning y otras veces hacemos heurísticas basados en una query SQL. Si bien el nombre del equipo es Machine Learning, no siempre lo usamos”, detalla el especialista. Su caso es por demás indicativo de lo importante de la alfabetización en datos: él es economista de la Universidad Católica Argentina pero arrancó a trabajar con datos en una primer pasantía de la universidad, en el Observador de la Deuda Social de la citada casa de estudios.

“La diferencia siempre fue saber programar y entender qué información tenés y cómo procesarla.”

- Fernando Croceri, gerente de Analítica y Data Science en Mercado Libre.

“Eso fue hace 13 años, tenía cierto interés por la econometría y la estadística y en esa pasantía de seis meses aprendí que los datos no eran solo una planilla de cálculo. Aprendí lo necesario sobre código para ser capaz de darle órdenes a una computadora para que haga cosas y eso me terminó llevando a entrar a una financiera donde tuve que aprender a programar scripts en bash (shell scripting). Ahí comencé a mezclar lo económico con la programación y la diferencia la hizo saber programar, conocer qué información tenés y cómo procesarla”, relata.

El valor agregado de su trabajo actual es saber generar el conocimiento necesario a partir de los datos en un contexto donde el volumen de datos crece más rápido que la capacidad de procesarlos. Los datos son tan disímiles como la forma de aproximarse a ellos. Es por esto que muchas compañías tienen un enfoque multidisciplinario, para lograr así abordarlos de la mejor forma posible, dado que hoy la estrategia tiene que estar basada en datos, según Croceri. “Mi equipo es interdisciplinario. Traté de armarlo así. Hay economistas, físicos, actuarios, matemáticos, ingenieros y otro perfiles”.

Pero en ocasiones hace falta un background previo que no todos tienen. A la hora de tomar personal, Croceri dice que el perfil de búsqueda depende del producto y depende del seniority. Cuando buscan perfiles de analistas juniors, el driver principal es que tengan pensamiento crítico, que sepan resolver problemas. Obviamente, si tienen conocimientos previos en datos, tanto mejor. En perfiles más seniors, mientras tanto, lo esencial es que sepan programar en SQL (en lenguaje específico para gestionar bases de datos), una herramienta esencial para cualquier puesto de datos, y que pueda hacer Business Intelligence y Machine Learning; o sea, que sea analista de negocios.

“El SQL te abre puertas, te permite ser independiente en la toma de decisiones porque podés hacer un reporte sin pedirle a nadie más. Eso te vuelve más ágil. Si fuera gerente de Marketing y no de Data Science, también pediría que mis analistas sepan SQL. En Mercado Libre fomentamos que todos los analistas y hacia arriba, managers y líderes de equipo, sepan generar sus propios insights basados en datos”, dice Croceri.

En la actualidad, a estos requisitos le agregaron programación en Python para llevar desarrollos a producción y, dependiendo de la orientación, requieren conocimientos específicos de ciencia de datos como Apache Spark (una solución Big Data orientada al procesamiento de datos), Apache Hive (una infraestructura de almacenamiento de datos construida sobre Hadoop para proporcionar agrupación, consulta, y análisis de datos, inicialmente desarrollada por Facebook) y Presto (un motor de consulta de base de datos), todos desarrollos basados en SQL.

En la escuela

Una de las ideas que circula cada tanto, y más cuando de cuestiones que tienen que ver con la salida laboral, es la posibilidad de actualizar los contenidos de la escuela secundaria con alguna forma de alfabetización en datos. Sin embargo, los dos especialistas consultados por Infotechnology no lo ven tan claro.

Para Walter Sosa Escudero, que chicos y chicas salgan con conocimientos extra de datos es deseable pero la cuestión no es tan sencilla porque en pedagogía tiene que haber un equilibrio y, además, el asunto se complica cuando se considera qué otra materia sacar y también la manera de llevarlo a cabo.

“La discusión es vacía si no te preguntás qué sacás y cómo lo vas a hacer, porque el sistema educativo debe estar equilibrado. Mucha gente se envalentona, te dicen que sí a Data Literacy, pero cuando preguntás si sacas historia, filosofía, álgebra, ese entusiasmo se diluye”, desarrolla.

Manuel Becerra es historiador, especialista en educación y desde este año parte de la secretaría de Eduación e Información Educativa del ministerio de Educación de la Nación. “Cómo se entiende una materia nueva, cómo se interpreta la necesidad que tiene el mundo de gente formada en un conocimiento nuevo como Data Science”, se pregunta para luego responderse que “se lo piensa de manera instrumental, cuando en la escuela lo que se aprende no tiene un uso instrumental inmediato”.

Aquí da un paso atrás y argumenta que las distintas maneras en que conocemos e interpretamos la realidad fueron creadas en la Modernidad y estas disciplinas, con variaciones, son todavía formas válidas de conocer el mundo. Por otro lado, señala, para agregar Ciencia de Datos a la enseñanza no basta con una reforma curricular sino que luego requiere una implementación que tomaría un minímo de cinco años dado que, además, hay que formar a los docentes o, en todo caso, buscar nuevos. También hay que estudiar luego los resultados de esas reformas que deberían incluir nueva infraestructura en un contexto presupuestario complejo.

“Hay que ser cuidadosos con una disciplina que nació hace algunas décadas y que quizás, tal como la conocemos hoy, no exista más en 10 ó 15 años”, dice. “Los tiempos de obsolescencia son muy veloces; lo mismo pasa en la computacion e informatica, tenés que renovar los contenidos todo el tiempo y esto implica también actualizar a los docentes.”

La propuesta de Becerra es trabajar el “aprendizaje por problemas” que integren las cuatro áreas clásicas: sociales, naturales, prácticas del lenguaje y matemáticas. O sea, trabajar a partir de una cuestión determinada como analizar el modelo agro-industrial en el país y eso cruzarlo a través de las diferentes materias.

Sosa Escudero apunta a lo mismo, dado que el tema datos ya está en la currícula pero se trabaja poco. Lo mejor, dice, sería reforzar el “razonamiento algorítmico probabilístico” e integrarlo con otros disciplinas más allá de la física, la matemática y la matemática financiera para llegar a disciplinas disímiles como la biología y las ciencias sociales.

“Hay que empujar desde otras disciplinas, hay que poner la carga en la sociología, en cómo realizar encuestas cuantitativas. Es fácil poner a discutir a un alumno o una alumna sobre la relevancia de la pobreza y cómo se mide. Desde ahí, es fácil hablar de la importancia de los datos.” “El dato por sí mismo no es nada, hay que entender que es la representación de algo en la vida real”, comenta Vidaguren.

Lo importante, plantea Vivas, es que los chicos puedan entender cómo funcionan las herramientas digitales que usan día a día, que entiendan para qué usan sus datos las redes sociales o por qué una app puede necesitar conocer la localización del usuario, por ejemplo. Se trata de ser mejores ciudadanos digitales, insiste. El resto llegará por añadidura



¿Te gustó la nota?

Comparte tus comentarios

Sé el primero en comentar

Notas Relacionadas