Python como utilizarlo para hacer análisis OCR
- Por ejemplo SAFEDATA
- Otra empresa es M-files , les puedo recomendar que contacten a esta empresa si quieren trabajar sus proyectos de administración de datos, tienen muchos proyectos muy interesantes. Pueden contactar a Erick Elizondo (https://mx.linkedin.com/in/elizondoerick).
- Otra opción en el mercado es Doclib https://www.doclib.net/
Programa en Python para utilizar OCR
Como tratamos en este blog quiero que veamos un ejemplo de como poder hacer algún programa que nos permita utilizar el tema del post y en esta ocasión vamos hacer un programa con Python y la librería tesseract https://github.com/tesseract-ocr.
Instalar Librería tesseract en Windows
Lo primero que tenemos que hacer es instalar la librería en Python para mi caso en Windows
Agregar leyenda |
Empezando con la instalación es un instalador donde nos pregunta que componentes
Tengo una imagen para probar de la liga de Tesseract
Luego desde un CMD vamos a probar el comando que lea la imagen y envie la información a un archivo tesseract example_03.png out
Hice una prueba con un archivo más complejo en cuanto a tamaño de letra, cantidad de texto, la calidad de la imagen borrosa
Aun así la librería obtiene la información bastante bien. Como pueden ver en la imagen de arriba.
Una ventaja de esta librería es que también hace la traducción a otro idioma.
Instalar paquete pytesseract en python
Ahora vamos instalar la librería pytesseract en Python
El programa en Python 3.7
La ejecución del programa
De la imagen con el texto
Alternativas de uso de OCR
La verdad es que con esta librería pueden hacer muchos proyectos interesantes a mi se me ocurre:
- Leer los datos de una factura y poder crear un XML o CSV para integrar a un ERP, por ejemplo tome una factura en imagen png y me llevo los datos.
- Probar como funciona el programa para leer datos por ejemplo de tarjetas de crédito o de acceso, yo intente con una tarjeta de circulación y no me regreso texto, pero con la función image_to_boxes si me indico que encontró texto.
- Si una persona con problemas visuales, creo que con esta herramienta se puede desarrollar un buen proyecto, quizá utilizando Arduino, una cámara de celular.
- En caso de ser estudiantes y quieren realizar notas o apuntes más rápido de algún texto.
- En mi caso por ejemplo utilizo esta librería para apoyarme en escribir en otro blog https://www.lecturasbibliacatolica.com/
Comentarios
Publicar un comentario