Herramientas de Inteligencia Artificial para pasar audio a texto

Los más recientes avances en inteligencia artificial están consiguiendo convertir en una tarea que se realiza de manera automática y prácticamente sin intervención humana lo que hasta ahora suponía una tediosa tarea: transcribir charlas, conferencias o entrevistas a texto.

Algunas herramientas de transcripción de texto pueden funcionar en cualquier idioma y en tiempo real gracias a la inteligencia artificial

Grabaciones de voz de gran longitud y complejidad quedan reducidas a tareas sencillas con la concurrencia de distintas herramientas que en algunos casos son incluso capaces de identificar de manera automática el idioma e incluso transcribir conversaciones en tiempo real.

Estas son algunas de las herramientas más efectivas, desarrolladas por algunas de las más importantes y bien conocidas empresas del sector tecnológico:

-Amazon Transcribe: Su destinatario principal son las empresas y está especializada en la transcripción en tiempo real de llamadas y conversaciones, siendo capaz de generar subtítulos, identificando de manera automática el idioma. De manera gratuita transcribe únicamente 60 minutos de audio al mes, disponiendo de distintas tarifas en función de la cantidad de minutos mensuales de conversación que se desee transcribir.

-Google Speech-to-Text: Además de ofrecer transcripciones desde audio a texto también cumple la función de control de voz y es capaz de ofrecer respuestas interactivas para plataformas de atención al cliente. Las transcripciones quedan almacenadas en Google Cloud. Los primeros 60 minutos de transcripción son gratuitos.

-IBM Watson Speech to Text: Es una de las herramientas más veteranas y fue desarrollada para generar archivos de texto a partir de grabaciones de audio de voz hablada de manera natural. Está específicamente dirigida a empresas de atención al cliente y también cuenta con funciones de asistente virtual. Ofrece 500 minutos gratis mensuales de transcripción.

-Microsoft Azure Speech to Text: Maneja más de 100 idiomas y permite agregar nuevas palabras al vocabulario de manera que puedan ser reconocidas en futuras transcripciones.

-Nuance Communications: Es una de las empresas pioneras en el reconocimiento de voz y en el procesamiento del lenguaje natural, siendo la desarrolladora de Siri, el asistente inteligente de Apple o Dragon Profesional, software de dictado para documentos clínicos. Este software tiene un precio cercano a los 500 euros.

Antonio Rentero

Comunicador especializado en tecnología y cine. Jurista especializado en protección de datos. Curioso especializado en prácticamente todo.

Deja un comentario

INFORMACIÓN BÁSICA SOBRE PROTECCIÓN DE DATOS

Responsable: TreceBits S.L. (TreceBits)
Finalidad: Que puedan comentar las noticias publicadas
Legitimación: Consentimiento del interesado. Satisfacción del interés legítimo del Responsable.
Destinatarios: No se cederán a terceros salvo obligación legal.
Derechos: Puedes ejercitar en cualquier momento tus derechos de acceso, rectificación, supresión, limitación, oposición y demás derechos legalmente establecidos a través del siguiente e-mail: [email protected].
Información adicional: Puedes consultar la información adicional y detallada sobre protección de datos aquí.