Esta IA es capaz de clonar tu voz en sólo 15 segundos

IA voz

Imagínate que alguien, teniendo acceso a 15 segundos de tu voz -algo muy fácil de conseguir, por ejemplo, a través de una Story en tu cuenta de Instagram o un vídeo que hayas subido a tu canal de YouTube- es capaz de clonar tu voz de manera exacta y hacerla reproducir cualquier frase que desee.

Esto, que puede parecer ciencia ficción, ya es posible realizarlo gracias a la nueva Inteligencia Artificial que ha presentado OpenAI -la empresa creadora de ChatGPT– y que abre todo un nuevo debate sobre los límites de la IA y cómo podría emplearse para crear «deep fakes» y audios falsos que comprometieran a las personas con frases que realmente ellos no habrían dicho, o que les llevaran a poder contratar servicios a través del teléfono imitando su voz.

Los riesgos, por el momento, son infinitos, por eso OpenAI ha decidido no lanzar Voice Engine -como se llama esta nueva IA- y abrir el uso de esta tecnología al gran público, al menos, hasta que no se tenga claro cómo limitar su uso y asegurar una aplicación que no ponga en riesgo a los usuarios.

Así funciona Voice Engine de OpenAI

Voice Engine fue desarrollado por OpenAI ya en 2022, pero hasta ahora han estado probando y perfeccionando esta nueva Inteligencia Artificial en secreto.

Esta IA permite crear voces muy realistas y emotivas solo con tener un ejemplo de audio de 15 segundos, imitando a la perfección la voz del usuario. A partir de ahí, puede reproducir ejemplos de texto incluso en idiomas diferentes al del usuario cuya voz ha clonado, imitando incluso su tono o muletillas que pueda tener.

Según OpenAI, esta nueva tecnología, que ha sido entrenada con bases de datos de voz públicas, tendría mucho potencial para usos como la asistencia durante la lectura, la traducción simultánea de contenidos o ayudar a personas con dificultades en el habla a recuperar su voz.

Sin embargo, también es necesario emplear políticas estrictas de uso que prohiban la utilización de la voz de una persona u organización sin su consentimiento explícito para cualquier fin para el que no haya sido informado.

De hecho, OpenAI ha reconocido abiertamente que generar imitaciones del discurso de otras personas puede tener, por el momento, series riesgos, por lo que todavía no va a permitir el empleo de esta tecnología a todos los ciudadanos. Por el momento, sólo algunas personas seleccionadas pueden probar Voice Engine, de la misma manera que sólo unos pocos tienen acceso a Sora, la herramienta de OpenAI que permite crear vídeo a partir de texto y que fue presentada hace solo unas semanas.

Según la compañía, hasta que no tengan más información sobre el uso de la herramienta, no podrán tomar una decisión sobre cuándo permitir el uso masivo de esta tecnología de forma responsable.

De todas formas, esta no es la única IA desarrollada en el mundo que permite imitar voces. Microsoft cuenta con una que permite remedar las voces de usuarios fallecidos, y Google también tiene una herramienta de IA que permite pasar de texto a voz con todo tipo de voces.

Manuel Moreno

Periodista y director de TreceBits. Experto en Redes Sociales, Internet y Tecnología. Formador y conferenciante. Colaborador en prensa, radio y TV. Autor de cinco libros de Social Media. Más información en manuelmoreno.es

Deja un comentario

INFORMACIÓN BÁSICA SOBRE PROTECCIÓN DE DATOS

Responsable: TreceBits S.L. (TreceBits)
Finalidad: Que puedan comentar las noticias publicadas
Legitimación: Consentimiento del interesado. Satisfacción del interés legítimo del Responsable.
Destinatarios: No se cederán a terceros salvo obligación legal.
Derechos: Puedes ejercitar en cualquier momento tus derechos de acceso, rectificación, supresión, limitación, oposición y demás derechos legalmente establecidos a través del siguiente e-mail: [email protected].
Información adicional: Puedes consultar la información adicional y detallada sobre protección de datos aquí.