LinuxParty
Colaborador Anónimo. escribió "Esta
guía describe como instalar Tesseract OCR en Ubuntu 7.04. OCR
significa: "Optical Character Recognition". El sistema resultabe podría
permitir la conversiones de las imágenes que forman el texto en
ficheros de Texto. Tesseract esta licenciado bajo el Apache License v2.0

El programa tesseract-ocr fue comprado por Google a HP hace varios años y la verdad es que reconoce incluso el texto en varias columnas, cosa que ni la versión 7 del famoso software de reconocimiento óptico de caracteres (OCR) de Adobe es capaz de hacer.
El programa lo podéis descargar desde https://code.google.com/p/tesseract-ocr/ , aunque la imagen tiene que estar en formato TIFF para que sea reconocida.
El artículo lo puede leer en:
https://www.howtoforge.com/ocr_with_tesseract_on_ubuntu704

-
Software
- Mejor que diff, meld, comparar gráficamente archivos y carpetas en Linux, y sencillo Control de Versiones
- Las 14 mejores herramientas para acceder al escritorio remoto de Linux
- Línea de Comandos Eficiente con GNU Perfect.
- 7 hábitos para editar texto de forma efectiva. -2.0-
- Oracle 11g, ha salido, primero para Linux.
- ¿Cómo limpiar el registro GNOME.?
- AprendeClick 1.0.1-beta
- WiKia, ha nacido!
- Linux Flash Plugin 9.0.48.0 (Flash Player 9)
- Impact, para estudiar la deformación de los materiales.
- Sparky, la definitiva barra de Alexa para FireFox.
- Equivalencias Windows en Linux



