“La magia de la Web es que permite publicar libremente”

Berthier Ribeiro-Neto, director de Ingeniería en Brasil y para América latina de Google, cuenta cómo trabajan desde la región para impulsar la oferta de Google. Las claves del motor de búsqueda y su relación con la nueva niña mimada, Google+. 04 de Mayo 2012
“La magia de la Web es que permite publicar libremente”
Desde Santiago, Chile - Berthier Ribeiro-Neto no es uno más en el equipo de más de 140 ingenieros en Google. El profesor, como lo llaman sus colegas, es considerado una de las mentes detrás de lo que es el core del negocio de la empresa de Mountain View, que hoy busca capitalizar el potencial que representan los 200 millones de usuarios de Internet en América latina.

Doctorado en Ciencias de la Computación de la Universidad de California en Los Ángeles, Ribeiro-Neto, es, además responsable del equipo de Ingeniería en Brasil y para América latina, como también autor de Modern Information Retrieval. La obra publicada en conjunto con el chileno Ricardo Baeza-Yates, en 1999, es considerada uno de los libros más importantes en materia de computación. Lanzada a una año de la creación de Google, se lee y entiende como una de las obras que marcaron la evolución del motor de búsqueda que transformó el mercado de search en el mundo. En el marco del Google Press Summit 5.0, que se desarrolló en Santiago de Chile, el ejecutivo dialogó con Infotechnology y contó qué impacto deja el talento latinoamericano en el desarrollo de Google.
  
 
¿En qué tipo de proyectos focalizan para el desarrollo en la región?
En Google tenemos la idea de tener una fuerza de ingenieros distribuidos por todo el mundo. Están en 30 lugares diferentes alrededor del globo. Y sería erróneo pensar que estamos haciendo proyectos locales. Todos los proyectos de ingeniería de Google, sin importar en dónde están, están siendo desarrollados con la única dimensión de ser globales. Como tal lo que hacemos es trabajar en proyectos para mejorar la calidad del funcionamiento del motor de búsqueda en lo que hace a la plataforma de Google + y mapas. En eso nos concentramos. Para hacerlo, nuestros grupos consisten de entre 25 a 30 ingenieros. La idea es tener el máximo talento posible para poder responder a la mayor parte de problemas posibles. Un 5 por ciento se reserva para enviar a otras dependencias fuera de nuestro ámbito.
 
No obstante, la cantidad de datos que hoy se produce y se replica vía Internet no deja de crecer. Por lo cual, el cual tiempo que tienen es cada vez menor. ¿Cómo hacen para no llegar tarde?
Todo lo que hacemos tiene que ver con datos. Ya sea social, búsquedas, big data. Como sabe, hoy se suben 60 horas de video por minuto a YouTube, por ejemplo. Hace no tanto tiempo –en 2006, cuando compramos la empresa- eran seis horas.  La pregunta es entonces cómo lidiar con ese problema. Uno tiene que trabajar con estructuras, que estén ubicada por encima de la data, que logren agrupar los datos, para decirlo en inglés, que permitan ordenar por clusters a la información. Y uno de los caminos que hacemos es tratar de ver cómo los usuarios usan la información.
 
Deme un ejemplo.
Imagínese que 300 usuarios hicieron la misma consulta y que todas esas consultas se pueden ordenar por tercios, en tres diferentes capas o niveles de consultas. Y, sobre esa estructura, uno puede encontrar referencias para ordenar la info en seis diferentes clusters, por ejemplo. Ese es el tipo de procesamiento por el cual podemos organizar la información que nos llega desde los usuarios. La dificultad es que uno tiene muchos más documentos o archivos que pueden ser relevantes para la consultas antes de lo que los usuarios pueden ver. Y eso es un problema que aún sigue sin encontrar una solución convincente. Para darle una idea del volumen de los que hablo: en un entorno académico, bien puede pasar que una consulta genere resultados en 10.000 millones documentos.
 
Los recientes estudios revelaron que, en América latina, lo que aún falta son contenidos en español. Hay más ingleses que contenidos en habla hispana y portuguesa. ¿Qué herramientas y capacidades tienen ustedes, desde el departamento de Ingeniería, para ayudar a mejorar o estimular esa situación?
Obviamente partimos de que somos capaces de agrupar desde ya la mayor cantidad de contenidos en español y portugués. Más allá de eso, el principal área para estimular este tipo de oferta es y seguirá siendo lograr una mayor penetración de Internet.
 
¿No hay nada que puedan hacer desde la instancia de búsquedas?
Se puede buscar una mayor concentración o crowding. Pero también depende de la situación en cada país. Por ejemplo, tome una país como Brasil. Tendrá un definida cantidad de páginas. A su vez, una fracción de esas páginas estarán linkeadas. Entonces, si uno ve la distribución de páginas por tamaño: un sitio tiene 10.000 páginas linkeadas, otro, 5.000 y otro, 2.000. Después, puedo fijarme en la distribución de esos links: cuántos por página puedo ver.  Eso me permite armar una idea de qué nivel de madurez tiene la Web en ese país o mercado. Lo mismo puedo hacer para un país como Perú o Paraguay. Y, si bien se trata de mercados mucho más chicos que Brasil, con escalas mucho más pequeñas, si el nivel de madurez de la Web, en esos países, es similar, se podrán encontrar distribuciones similares. Por eso lo que se debe lograr es sumar cada vez más usuarios. Porque la magia de la Web es que le permite a las personas y a los usuarios subir y publicar contenido libremente y eso es lo que atrae también a otras personas a animarse a aprovechar esa posibilidad. Y ese deseo, esa necesidad, es lo que se debe estimular para lograr contenidos en nuestro idioma. Para que la Web también sirva cada vez más a los usuarios con el servicio que ellos necesitan.
 
 
Se refiere a que, hoy, las personas, para buscar restaurantes, comprar libros o armar viajes se basan cada vez más en las recomendaciones que encuentran en la Web.
Si, pero, justamente, aquí todavía hay una predominancia en inglés. Uno de nuestros colegas estuvo buscando información para hacer trekking en el Desierto de Atacama, pero la mayoría que encontró fue en inglés. Los Latinaomericanos todavía no hacen y usan las plataformas disponibles para hacer comentarios, revisiones y distribuir así su propio conocimiento. Si lo hacen con fotos, pero no en cuanto a producir contenido informativo.
 
Con la integración de la oferta de Google en camino desde la plataforma de Google+, la respuesta de su empresa a Facebook y Twitter, y la preponderancia que adquirió el elementos social en las búsquedas de todas las empresa del sector, ¿Search podría quedar completamente integrada a Google+, transformándose lo social en el nuevo core de la empresa?
Es algo que hoy no se sabe. Es un problema abierto. Hay que ver cómo y hacia dónde evoluciona la tecnología y cómo logramos entender cuál es la mejor forma para combinar la información social con las búsquedas.
 
 
QUIÉN ES:
Director de Ingeniería en Brasil y para América latina, de Google, doctorado en Ciencias de la Computación de la Universidad de California en Los Ángeles. Está involucrado en varios proyectos de investigación financiados por agencias brasileñas. Ha presidido destacadas conferencias en América del Sur y es miembro de ACM, IEEE y ASIS. Es profesor asociado en el Departamento de Ciencias de la Computación de la Universidad Federal de Minas Gerais, en Belo Horizonte, Brasil.

El potencial de Internet, en cifras
Sólo el 0,3 por ciento del PBI de América latina se genera en Internet
36% es la penetración promedio en la región es de
64% es la penetración en la Argentina, con 26 millones de usuarios
22 por ciento creció, cada año, la cantidad de altas de dispositivos móviles en la Argentina. En países desarrollados como EE.UU (9%), GB (7%)
9 veces logran multiplicar su negocio las Pymes que están en Internet
US$ 2.000 millones son lo que pierden las pymes regionales por no estar en Internet
Fuente: Boston Consulting Group / McKinsey



¿Te gustó la nota?

Comparte tus comentarios

Sé el primero en comentar