LinuxParty
Colaborador Anónimo. escribió "Esta
guía describe como instalar Tesseract OCR en Ubuntu 7.04. OCR
significa: "Optical Character Recognition". El sistema resultabe podría
permitir la conversiones de las imágenes que forman el texto en
ficheros de Texto. Tesseract esta licenciado bajo el Apache License v2.0

El programa tesseract-ocr fue comprado por Google a HP hace varios años y la verdad es que reconoce incluso el texto en varias columnas, cosa que ni la versión 7 del famoso software de reconocimiento óptico de caracteres (OCR) de Adobe es capaz de hacer.
El programa lo podéis descargar desde https://code.google.com/p/tesseract-ocr/ , aunque la imagen tiene que estar en formato TIFF para que sea reconocida.
El artículo lo puede leer en:
https://www.howtoforge.com/ocr_with_tesseract_on_ubuntu704

-
Software
- Mejor que diff, meld, comparar gráficamente archivos y carpetas en Linux, y sencillo Control de Versiones
- Las 14 mejores herramientas para acceder al escritorio remoto de Linux
- El software de declaración de impuestos del IRS que TurboTax intenta eliminar se ha vuelto de código abierto
- Seis programas de software libre para el día a día de la empresa
- Joomla 6, ¿Qué hay para ti?
- Suiza ahora exige que todo el software gubernamental sea de código abierto
- ¿Qué significa la IA de código abierto, de todos modos?
- La importancia de los diseñadores para conseguir un photocall personalizado impactante
- Disponible ONLYOFFICE Docs 8.0: formularios PDF, RTL, Buscar, asistente de gráficos, plugins actualizada y más
- 14 mejores sistemas operativos para Internet de las cosas (IoT)
- Cómo instalar Odoo 15 en CentOS 8 y 9 / AlmaLinux 8 y 9
- RustDesk la alternativa a TeamViewer y AnyDesk para Windows, Linux y Mac



