Google desarrolla una app para personas con dificultades en el habla
Google está desarrollando una app para Android que facilite la comunicación a las personas con dificultades en el habla. Project Relate es el nombre del proyecto que pretende generar una transcripción automática de un discurso hablado a la vez que sintetiza la información para que sea más fácilmente comprensible por el interlocutor.
Project Relate es una iniciativa de Google para dotar de herramientas comunicativas a personas con dificultades en el habla
La semilla de esta idea proviene del Proyecto Euphonia, una iniciativa de Google nacida en 2019 y que pretende dotar de herramientas comunicativas a personas con algún tipo de impedimento en el habla. Este proyecto, basado en una solución de Inteligencia Artificial, fue dirigido por Dimitri Kanevsky, un investigador de Google que tiene el habla dañada debido a una enfermedad. Aubriee Lee, trabajadora en el departamento de marketing, es otra de las beneficiadas por esta tecnología. Ella misma aparece en el vídeo promocional explicando el proyecto de Google.
Los sistemas de reconocimiento del habla precisan de una gran cantidad de grabaciones para aprender a interpretar correctamente lo que se está diciendo. Por lo general, estas bases de datos incluyen principalmente grabaciones de personas con un habla correcta. Por ese motivo, es difícil conseguir que los sistemas de reconocimiento sean compatibles con formas de hablar dañadas o con acentos muy marcados.
Para superar este obstáculo, Google ha estado recogiendo grabaciones del habla de personas con dificultades. De este modo, la compañía ha generado una base de datos con cerca de un millón de muestras del habla de voluntarios.
A partir de esta información, Google ha podido ir entrenando a su sistema de reconocimiento del habla guiado por Inteligencia Artificial. Para proseguir con el desarrollo, Google está reclutando voluntarios que usen la app para poder así subsanar sus defectos.
Este pasado verano la empresa presentó otra herramienta de Inteligencia Artificial. Se trata de Multitask Unified Model, un algoritmo que cuenta capaz de ofrecer respuestas tan complejas que el algoritmo anterior hubiese necesitado hasta ocho búsquedas diferentes.