Si se le pregunta a un ser humano si dos fotos que no ha visto nunca muestran a la misma persona, acertará en un 97,53% de los casos. Un nuevo software desarrollado por investigadores de Facebook consigue una precisión del 97,25% en la misma situación, independientemente de variaciones en la iluminación o si la persona de la foto está de frente o de perfil.
Es un avance significativo respecto a programas de software anteriores para la identificación de caras, y demuestra el poder de un nuevo enfoque de la inteligencia artificial (IA) conocido como aprendizaje profundo, por el que Facebook y sus competidores han estado apostando en serio en el último año (ver "Aprendizaje profundo"). Este campo de la IA implica un software que usa redes de neuronas simuladas para aprender a reconocer patrones en grandes series de datos.
"Normalmente no se consiguen mejoras de este calibre", explica el miembro del equipo de investigación en IA de Facebook, Yaniv Taigman. Este grupo se creó el año pasado para explorar cómo el aprendizaje profundo podría ayudar a la empresa (ver "Facebook lanza un proyecto avanzado de IA para encontrar el sentido de tus actualizaciones"). "Nos acercamos muchísimo a la precisión humana", afirma Taigman sobre el nuevo software. Señala que la tasa de error se ha reducido en más de un 25% respecto a programas anteriores encargados de la misma tarea.
El nuevo software de Facebook, llamado DeepFace, lleva a cabo lo que los investigadores denominan verificación facial (reconoce que dos imágenes muestran la misma cara), no reconocimiento facial (poner nombre a una cara). Pero Taigman sostiene que algunas de las técnicas subyacentes se podrían aplicar a ese problema y, por lo tanto, podrían mejorar la fiabilidad de Facebook a la hora de sugerir a quién deben etiquetar los usuarios en una foto que acaban de subir.
Sin embargo, por el momento DeepFace sólo es un proyecto de investigación. Facebook presentó un artículo de investigación sobre el proyecto la semana pasada, y los investigadores presentarán el trabajo en la Conferencia IEEE sobre Visión Artificial y Reconocimiento de Patrones en junio. "Vamos a publicar nuestros resultados para conseguir elfeedback de la comunidad investigadora", explica Taigman, desarrollador de DeepFace junto con sus compañeros de Facebook Ming Yang y Marc'Aurelio Ranzato y el profesor de la Universidad de Tel Aviv (Israel) Lior Wolf.
DeepFace procesa las imágenes en dos pasos. Primero corrige el ángulo de la cara para que la persona en la foto esté mirando al frente, usando un modelo en 3D de una cara "media" que mira al frente. Entonces entra en acción el aprendizaje profundo como una red neural simulada para elaborar una descripción numérica de la cara reorientada. Si DeepFace descubre una cantidad suficiente de descripciones parecidas en dos imágenes distintas, decide que debe tratarse de la misma cara.
El rendimiento del software final se probó contra una serie de datos estándar usada por los investigadores para calibrar el software de procesado de caras, que también se ha usado para medir cómo se le da a los humanos emparejar rostros.
El investigador de la Universidad de Washington (EEUU) Neeraj Kumar, que ha trabajado en verificación y reconocimiento facial, afirma que los resultados de Facebook demuestran que encontrar una cantidad suficiente de datos con los que alimentar a una red neural grande puede dar lugar a mejoras significativas en el software de aprendizaje automático. "Estoy seguro que gran parte de las mejoras en este caso provienen de lo que proporciona el aprendizaje profundo: poder manejar ingentes cantidades de datos externos en un modelo de aprendizaje con muchísima más capacidad", afirma.
La parte de aprendizaje profundo de DeepFace consiste en nueve capas de neuronas simuladas sencillas, con más de 120 millones de conexiones entre ellas. Para entrenar esta red, los investigadores de Facebook cogieron una minúscula serie de datos del almacén de imágenes de los usuarios de su empresa, cuatro millones de fotos de caras que pertenecen a casi 4.000 personas. "Como tienen acceso a muchos datos de este tipo pueden entrenar con éxito un modelo de gran capacidad", afirma Kumar.
Publicado
http://www.technologyreview.es/read_article.aspx?id=44966