«Look to Speak» (Mirar para hablar) es una función que por el momento va a estar disponible únicamente en los altavoces inteligentes Google Nest Hub, dotados de pantalla y cámara de vídeo, y que permitirá que el asistente inteligente de Google sólo se active si el usuario está mirando al dispositivo y está lo suficientemente cerca como para detectar que se desea mantener una interacción con él.
Google Nest Hub analiza parámetros como el tono de voz o la mirada y orientación de la cabeza del usuario
Se trata de una tecnología presentada por Google en el año 2020 y que desde entonces ha ido avanzando con el objetivo de estar algún día integrado en todo tipo de dispositivos y así por un lado no sea siempre necesario decir «OK, Google» para activarlo y que, por otra parte, si en alguna ocasión se pronuncia la palabra «Google» cerca de algún dispositivo con el asistente inteligente integrado éste no se active por error.
La base de «Look to Speak» es que el dispositivo inteligente tiene en cuenta diversos parámetros para detectar si el usuario desea hacerle una consulta o lanzarle una invocación o una orden. Para ello es determinante verificar que el usuario está mirando al dispositivo, como signo inequívoco de que se desea mantener una comunicación con el mismo, tal y como sucede con las conversaciones entre personas.
En el pasado evento Google I/O se explicó que «Look to Speak» ya es capaz de analizar información recibida por audio, vídeo y texto para detectar la voluntad de mantener la interacción con el asistente inteligente.
El primer dispositivo en incluir esta tecnología es el dispositivo inteligente Google Nest Hub, capaz de analizar mediante su cámara no sólo si el usuario está mirando al dispositivo sino que también tiene en cuenta que el usuario se encuentre físicamente cerca, que la cabeza y la mirada estén orientadas hacia él y si la distancia es adecuada para mantener una conversación.
En cuanto a la voz, al estar vinculada con Voice Match de Google, «Look to Speak» es capaz de discriminar si quien habla no es el usuario registrado y no interactuará con nadie cuya voz no haya registrado y reconocido previamente como alguien autorizado. Igualmente es capaz de analizar si por el tono de voz y la velocidad se trata de una conversación natural con otra persona o realmente se busca dirigirse al asistente de Google.