Cómo convertir imagen a texto con tecnología OCR
Gracias a las herramientas de Inteligencia Artificial y al aprendizaje automático, aplicadas al reconocimiento de texto, hoy en día es posible traducir textos en tiempo real o transcribir el texto de una imagen con solo enfocarlo con la cámara fotográfica del móvil.
La tecnología OCR nació en los laboratorios de Hewell-Packard, pero en la actualidad está siendo financiado por Google
La tecnología de reconocimiento óptico, optical character recognition (OCR), es una de las herramientas de digitalización más conocidas y utilizadas en todo el mundo para pasar documentos físicos a documentos digitales. OCR es una herramienta de software libre, que cuenta con su propio repositorio en Github, para que los desarrolladores puedan tener acceso a ella y utilizarla para crear sus propias aplicaciones.
El desarrollo de OCR se inició en los laboratorios de Hewell-Packard y ahora está financiado por Google y es compatible con todos los sistemas operativos que existen. La última versión de la herramienta, llamada Tesseract 4, utiliza redes neuronales para traducir imágenes a texto y es compatible con más de un centenar de idiomas.
OCR Tesseract funciona mediante líneas de comandos. En este sentido, aunque en la información oficial de la herramienta se ofrece una completa guía de uso y de comandos, en realidad no es sencillo utilizarla así. Por suerte, existen algunas aplicaciones que ayudan a manejar esta herramienta mediante una aplicación, como es el caso de gImageReader.
Qué es gImageReader
gImageReader es una aplicación gratuita y de licencia libre (GPL 3.0), disponible para Windows y Linux, que es capaz de convertir imágenes en texto. En este sentido, si se abre una imagen que contiene un texto, la herramienta detecta el texto, lo extrae y lo convierte en un documento de texto, por ejemplo, en un Word.
En este sentido, es posible convertir el texto desde imágenes dentro de un PDF, desde imágenes en varios formatos y desde diferentes dispositivos, incluso desde capturas de pantallas o desde una imagen que se hay copiado al portapapeles.
En la siguiente imagen se puede apreciar la interfaz de usuario de gImageReader:
En función de la calidad de resolución de la imagen, el reconocimiento de texto se podrá hacer de forma manual o automática. Una vez convertida la imagen en texto, es posible darle formato o editarlo, para corregir cualquier error gramatical u ortográfico.