Desbloquear el futuro – ese fue el tema que Rick Rashid, Gerente de investigación de Microsoft, utilizó para cerrar su ponencia de apertura durante el primer día del Machine Learning Summit 2013 de Microsoft Research.

El evento, llevado a cabo en Le Campus de Microsoft, ubicado en Issy-les-Moulineaux, Francia, a las afueras de París, reunió a líderes de opinión e investigadores de un amplio rango de disciplinas relacionadas con el cómputo para enfocarse en retos clave en una nueva era del aprendizaje de cómputo e identificar lo que será necesario para aprovechar los recursos de información actuales y futuros para mejorar a toda la sociedad.

Evelyne Viegas de Microsoft Research Connections inauguró el evento con algunos comentarios introductorios antes de presenter a Alain Crozier, presidente de Microsfot Francia, que dio la bienvenida a cerca de 250 asistentes al evento. A continuación, Viegas llamó al escenario a Rashid para que ofreciera unas palabras a los asistentes.

“El tema del aprendizaje de máquinas se ha vuelto muy emocionante en los últimos 10 años”, dijo. “El ritmo del cambio ha sido en verdad dramático, por lo que es muy agradable reunir a tanta gente de tantas áreas diferentes para que estén aquí y hablen sobre este tema”.

Rashid recordó una época en un pasado no tan lejano en el que el aprendizaje de cómputo se encontraba en su fase inicial, en la que se utilizaban reglas y reconocimiento de patrones para producir resultados que eran poco menos que excelentes. Pero hoy, remarcó, una combinación de datos, dispositivos y servicios ha llevado a un recién descubierto respeto por la disciplina, que comienza a tener un impacto cada vez mayor en los negocios y la sociedad.

Rashid comentó sobre los avances en las redes neurales profundas que han presentado importantes mejoras en la traducción habla-a-habla, para trazar un camino del reconocimiento del habla a la traducción de máquina a la síntesis personalizada del habla. También compartió con la audiencia un video de su plática presentada en Beijing, en octubre del año pasado, en la que sus comentarios en inglés fueron transformados al Mandarín, en su propia voz, frente a un grupo de académicos chinos.

“Creo que lo que es interesante”, concluyó Rashid, “sobre esta demostración y también sobre los cambios que han comenzado a suceder en el campo del aprendizaje de máquinas, en especial con las nuevas técnicas que se han desarrollado como las redes neurales profundas, es el súbito optimismo que se presenta para algunos de los grandes problemas de la ciencia del cómputo… ahora, es probable que estemos ante la luz al final del túnel, que podamos ver, no sólo en nuestra época, sino también en no mucho tiempo, que esos problemas críticos se resuelvan”.

Para ampliar este tema, Christopher Bishop, un distinguido científico de Microsoft, basado en Microsoft Research Cambridge y con-anfitrión del evento, presentó a Andrew Blake, director del laboratorio de la instalación, para discutir la visión de la computadora en una presentación llamada Machines That (Learn To) See (Máquinas que [Aprenden a] Ver).

Andrew Blake during the Machine Learning Summit 2013

Andrew Blake durante el Machine Learning Summit 2013

“En el estudio de la visión de las computadoras”, dijo Blake, “tenemos una visión inmensa y privilegiada del estudio de la inteligencia. Hay muchos científicos que tratan de estudiar la inteligencia desde diferentes puntos de vista. Algunos de ellos se han puesto la tarea de entender a detalle qué es el circuito neural del cerebro. Aceptar esa limitación de una explicación biológica completa de la inteligencia es una carga pesada en extremo.

“Lo que tenemos en los estudios computacionales es la oportunidad de hacerlo desde una perspectiva totalmente diferente, donde estudiamos la inteligencia, en un sentido, desde un punto de vista abstracto, aligerado por algunos de los detalles”.

Blake prosiguió con una descripción de dos estilos modernos de la investigación de la visión de las computadoras, uno sobre detectores empíricos y otro de análisis por síntesis. No dejó dudas respecto a que estaba cautivado en lo personal por el último, y mencionó avances en el desarrollo del proyecto de la estimación de pose humana de Kinect y el sistema Photosynth que genera una reconstrucción de imágenes en 3D desde una colección de fotos de un mismo tema.

Apuntó hacia el futuro, donde los dos estilos podrían fusionarse para producir aún más avances, y sugirió que el muestro dirigido por datos podría ser un prometedor paso hacia adelante.

“Mientras pensamos en los problemas y cómo resolverlos en la forma más sistemática”, Blake concluyó, “existen muchas otras cosas en la visión ahora que en verdad funcionan, se trate de cámaras, software, imagen médica, autos que se manejan solos, y nuevas interfaces de usuario. Es un excelente logro que la visión haya madurado”.