Cómo convertir imagen a texto con tecnología OCR

gImageReader tratamiento de imágenes

Gracias a las herramientas de Inteligencia Artificial y al aprendizaje automático, aplicadas al reconocimiento de texto, hoy en día es posible traducir textos en tiempo real o transcribir el texto de una imagen con solo enfocarlo con la cámara fotográfica del móvil.

La tecnología OCR nació en los laboratorios de Hewell-Packard, pero en la actualidad está siendo financiado por Google

La tecnología de reconocimiento óptico, optical character recognition (OCR), es una de las herramientas de digitalización más conocidas y utilizadas en todo el mundo para pasar documentos físicos a documentos digitales. OCR es una herramienta de software libre, que cuenta con su propio repositorio en Github, para que los desarrolladores puedan tener acceso a ella y utilizarla para crear sus propias aplicaciones.

El desarrollo de OCR se inició en los laboratorios de Hewell-Packard y ahora está financiado por Google y es compatible con todos los sistemas operativos que existen. La última versión de la herramienta, llamada Tesseract 4, utiliza redes neuronales para traducir imágenes a texto y es compatible con más de un centenar de idiomas.

OCR Tesseract funciona mediante líneas de comandos. En este sentido, aunque en la información oficial de la herramienta se ofrece una completa guía de uso y de comandos, en realidad no es sencillo utilizarla así. Por suerte, existen algunas aplicaciones que ayudan a manejar esta herramienta mediante una aplicación, como es el caso de gImageReader.

Qué es gImageReader

gImageReader es una aplicación gratuita y de licencia libre (GPL 3.0), disponible para Windows y Linux, que es capaz de convertir imágenes en texto. En este sentido, si se abre una imagen que contiene un texto, la herramienta detecta el texto, lo extrae y lo convierte en un documento de texto, por ejemplo, en un Word.

En este sentido, es posible convertir el texto desde imágenes dentro de un PDF, desde imágenes en varios formatos y desde diferentes dispositivos, incluso desde capturas de pantallas o desde una imagen que se hay copiado al portapapeles.

En la siguiente imagen se puede apreciar la interfaz de usuario de gImageReader:

gImageReader interfaz de usuario

En función de la calidad de resolución de la imagen, el reconocimiento de texto se podrá hacer de forma manual o automática. Una vez convertida la imagen en texto, es posible darle formato o editarlo, para corregir cualquier error gramatical u ortográfico.

Jaume Vicent

Redactor y especialista en SEO y marketing de contenidos. Friki de las redes sociales y de las nuevas tecnologías.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

INFORMACIÓN BÁSICA SOBRE PROTECCIÓN DE DATOS

Responsable: TreceBits S.L. (TreceBits)
Finalidad: Que puedan comentar las noticias publicadas
Legitimación: Consentimiento del interesado. Satisfacción del interés legítimo del Responsable.
Destinatarios: No se cederán a terceros salvo obligación legal.
Derechos: Puedes ejercitar en cualquier momento tus derechos de acceso, rectificación, supresión, limitación, oposición y demás derechos legalmente establecidos a través del siguiente e-mail: [email protected].
Información adicional: Puedes consultar la información adicional y detallada sobre protección de datos aquí.