Cómo convertir imagen a texto con tecnología OCR

gImageReader tratamiento de imágenes

Gracias a las herramientas de Inteligencia Artificial y al aprendizaje automático, aplicadas al reconocimiento de texto, hoy en día es posible traducir textos en tiempo real o transcribir el texto de una imagen con solo enfocarlo con la cámara fotográfica del móvil.

La tecnología OCR nació en los laboratorios de Hewell-Packard, pero en la actualidad está siendo financiado por Google

La tecnología de reconocimiento óptico, optical character recognition (OCR), es una de las herramientas de digitalización más conocidas y utilizadas en todo el mundo para pasar documentos físicos a documentos digitales. OCR es una herramienta de software libre, que cuenta con su propio repositorio en Github, para que los desarrolladores puedan tener acceso a ella y utilizarla para crear sus propias aplicaciones.

El desarrollo de OCR se inició en los laboratorios de Hewell-Packard y ahora está financiado por Google y es compatible con todos los sistemas operativos que existen. La última versión de la herramienta, llamada Tesseract 4, utiliza redes neuronales para traducir imágenes a texto y es compatible con más de un centenar de idiomas.

OCR Tesseract funciona mediante líneas de comandos. En este sentido, aunque en la información oficial de la herramienta se ofrece una completa guía de uso y de comandos, en realidad no es sencillo utilizarla así. Por suerte, existen algunas aplicaciones que ayudan a manejar esta herramienta mediante una aplicación, como es el caso de gImageReader.

Qué es gImageReader

gImageReader es una aplicación gratuita y de licencia libre (GPL 3.0), disponible para Windows y Linux, que es capaz de convertir imágenes en texto. En este sentido, si se abre una imagen que contiene un texto, la herramienta detecta el texto, lo extrae y lo convierte en un documento de texto, por ejemplo, en un Word.

En este sentido, es posible convertir el texto desde imágenes dentro de un PDF, desde imágenes en varios formatos y desde diferentes dispositivos, incluso desde capturas de pantallas o desde una imagen que se hay copiado al portapapeles.

En la siguiente imagen se puede apreciar la interfaz de usuario de gImageReader:

gImageReader interfaz de usuario

En función de la calidad de resolución de la imagen, el reconocimiento de texto se podrá hacer de forma manual o automática. Una vez convertida la imagen en texto, es posible darle formato o editarlo, para corregir cualquier error gramatical u ortográfico.

Jaume Vicent

Redactor y especialista en SEO y marketing de contenidos. Friki de las redes sociales y de las nuevas tecnologías.

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    • TreceBits te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por Manuel Moreno Molina (TreceBits) como responsable de esta web.
    • La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para gestionar la solicitud que realizas en este formulario de contacto.
    • Legitimación: Consentimiento del interesado.
    • Como usuario e interesado te informamos que los datos que nos facilitas estarán ubicados en los servidores de SiteGround Spain S.L. (proveedor de hosting de TreceBits). SiteGround Spain S.L. está ubicado en la UE, cuyo nivel de protección son adecuados según Comisión de la UE. Ver política de privacidad de SiteGround Spain S.L.
    • Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en info@trecebits.com así como el derecho a presentar una reclamación ante una autoridad de control.
    • Puedes consultar la información adicional y detallada sobre Protección de Datos en nuestra política de privacidad.