Una start-up está desarrollando una tecnología de aprendizaje de máquinas que imita la forma en que funciona el oído, y creen que facilitará que los teléfonos inteligentes y dispositivos portátiles estén atentos constantemente ante sonidos de peligro.
One Llama mostrará algunas de sus capacidades en una aplicación llamada Audio Aware, diseñada para alertar a usuarios de teléfonos inteligentes con dificultades de audición y a "transeúntes distraídos" (un tema explorado anteriormente en "¿Mensajes de texto seguros mientras caminas? Puede haber una aplicación para ello"). La aplicación, que se lanzará en marzo, se ejecutará en segundo plano en un teléfono Android y detectará sonidos como el chirrido de neumáticos y sirenas, y te alertará sobre ellos por ejemplo interrumpiendo la música que estés escuchando. La aplicación conocerá una serie de sonidos peligrosos, y los usuarios podrán añadir sus propios sonidos a la aplicación y compartirlos con otras personas.
One Llama espera que Audio Aware despierte el interés entre los fabricantes de aparatos portables, que podrían incluir la tecnología en gafas y relojes inteligentes, así como en seguidores de fitness. En estos dispositivos, Audio Aware podría hacer algo más que estar alerta ante peligros: supervisar las condiciones de salud, los entrenamientos, e incluso las localizaciones mediante el análisis de los sonidos que haces y los ruidos a tu alrededor. Los observadores de aves podrían usarlo para diferenciar entre, digamos, un gorrión macho astillado y un junco de ojos oscuros.
El quid de la tecnología de One Llama es lo que la compañía denomina como su "oído artificial". Cuando el sonido entra en el oído viaja a través de la cóclea, en forma de espiral, y se alinea con células ciliadas que vibran como diapasones cuando son golpeadas por ciertas frecuencias. La oreja artificial de One Llama es una versión de software de este sistema, esencialmente un banco de diapasones digitales que miden los sonidos. Está basada en un trabajo que el científico de investigación de la Universidad de Illinois (EEUU) y cofundador David Tcheng llevó a cabo con otros colegas.
La compañía afirma que este método puede ser más rápido y más flexible que otros métodos comunes para el análisis de las diferentes frecuencias de las vibraciones que oímos como sonidos.
En el caso de Audio Aware, Tcheng señala que funciona escuchando los sonidos través del micrófono del teléfono inteligente, y compárandolos constantemente con plantillas almacenadas de los sonidos de alerta que tiene que reconocer. Cuando se detecta una coincidencia lo suficientemente notable, como la bocina de un coche, detiene cualquier archivo de audio que estés escuchando y reproduce una versión amplificada del sonido que está recogiendo, o tal vez una versión caricaturesca de ese sonido que sea más fácil de reconocer.
Audio Aware será capaz de trabajar sin acceso a una red inalámbrica, pero tendrá que transmitir el audio a un servidor remoto cuando aprenda nuevos sonidos, por ejemplo en un nuevo país donde las sirenas sean diferentes.
¿Puede la aplicación hacer todo lo que tiene que hacer a tiempo para avisarte antes de que te atropelle un coche? Tcheng reconoce el reto, pero cree que el software extrae características de audio con la suficiente rapidez como para ayudar efectivamente a los usuarios en tiempo real. Pero la tecnología de One Llama no es infalible. Tcheng me hizo una demostración de cómo la tecnología de One Llama podía distinguir varios sonidos, entre ellos cristales rotos, un timbre de puerta y una bocina, por encima del ruido de la radio y un gato maullando en su casa. Aunque el software identificó correctamente sonidos como cristales rotos, también identificó incorrectamente un timbre de puerta. Con el tiempo, es de suponer que el sistema aprenderá la diferencia.
El profesor de la Universidad Carnegie Mellon (EEUU) Richard Stern, que investiga el reconocimiento de voz, afirma que los métodos de procesamiento de sonido basados en el funcionamiento de la cóclea se han vuelto algo cada vez más común, en parte porque la potencia de procesamiento de los ordenadores se ha abaratado mucho con el tiempo.
Prestar atención a cómo procesa el sistema auditivo las señales puede ser útil para el reconocimiento de sonidos, particularmente en ambientes ruidosos, señala. Pero la complejidad de los sonidos que nos encontramos cada día hace que los sistemas de reconocimiento de sonido estén constantemente intentando diferenciar una señal entre muchas otras, y es prácticamente imposible predecir cómo se van a combinar dichas señales. Los seres humanos están todavía muy por delante de los ordenadores en ese sentido.
Sitio OneLLama
http://www.onellama.com/
Publicado
http://www.technologyreview.es/read_article.aspx?id=44894