La Inteligencia Artificial ya recrea la voz humana

gImageReader tratamiento de imágenes

La inteligencia artificial (IA) tiene cada vez más usos en más campos, y aunque en los últimos meses está siendo muy popular su utilización para la generación de imágenes a partir de descripciones de texto natural ahora ha llegado el momento de cambiar de la imagen al sonido, en concreto a la voz humana.

La IA de AudioLM es capaz de reproducir tono, timbre, articulación y hasta las pausas para la respiración de un hablante

Una de las últimas presentaciones de la división de investigación de Google ha sido AudioLM, una IA capaz de generar audio de alta calidad a partir de una grabación de voz humana de unos pocos segundos. Una de sus características distintivas es que no requiere de un proceso previo de entrenamiento a base de transcripciones previas, manteniendo la naturaleza sintáctica y semántica del orador sobre el que desarrolla su nuevo “discurso”.

Más allá de ser capaz de reproducir con fidelidad el tono, el timbre, la intensidad o la articulación de la voz de partida también puede añadir los sonidos del hablante al respirar y, por supuesto, formar frases con sentido. AudioLM lo consigue a partir del análisis de marcadores semánticos y acústicos, actuando los primeros como condicionantes para los terceros.

A partir de estas capacidades AudioLM también es capaz de traducir a voz textos o permitir que los sistemas informáticos o los asistentes inteligentes puedan generar voz sintética. Por el momento Google no ha abierto al público el uso de AudioLM, pero no es esta la única IA especializada en esta labor.

Uno de los casos más populares en que se ha utilizado esta tecnología ha sido la serie “Obi Wan Kenobi”, de la plataforma de streaming Disney+. En la misma la voz del personaje Darth Vader no ha estado doblada por el actor que tradicionalmente se encarga de ponerle voz en la pantalla cinematográfica, James Earl Jones sino que se ha recreado y “clonado” su voz por parte de la empresa ucraniana Respeecher.

Jones firmó un contrato por el que permitía el tratamiento del archivo de grabaciones con su voz mediante IA de manera que el estudio pudo contar con nuevas líneas de diálogo con la voz del Señor Oscuro del Sith sin que el actor, de 91 años, tuviera que pasar por el estudio de doblaje.

Precisamente otro producto de la factoría Disney, división Lucasfilm, también contó con el uso de esta tecnología para recrear la voz de Luke Skywalker en la serie “El libro de Boba Fett” de manera sintética.

Antonio Rentero

Comunicador especializado en tecnología y cine. Jurista especializado en protección de datos. Curioso especializado en prácticamente todo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

 

  • TreceBits te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por Manuel Moreno Molina (TreceBits) como responsable de esta web.
  • La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para gestionar la solicitud que realizas en este formulario de contacto.
  • Legitimación: Consentimiento del interesado.
  • Como usuario e interesado te informamos que los datos que nos facilitas estarán ubicados en los servidores de SiteGround Spain S.L. (proveedor de hosting de TreceBits). SiteGround Spain S.L. está ubicado en la UE, cuyo nivel de protección son adecuados según Comisión de la UE. Ver política de privacidad de SiteGround Spain S.L.
  • Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en [email protected] así como el derecho a presentar una reclamación ante una autoridad de control.
  • Puedes consultar la información adicional y detallada sobre Protección de Datos en nuestra política de privacidad.