LinuxParty
Colaborador Anónimo. escribió "Esta
guía describe como instalar Tesseract OCR en Ubuntu 7.04. OCR
significa: "Optical Character Recognition". El sistema resultabe podría
permitir la conversiones de las imágenes que forman el texto en
ficheros de Texto. Tesseract esta licenciado bajo el Apache License v2.0

El programa tesseract-ocr fue comprado por Google a HP hace varios años y la verdad es que reconoce incluso el texto en varias columnas, cosa que ni la versión 7 del famoso software de reconocimiento óptico de caracteres (OCR) de Adobe es capaz de hacer.
El programa lo podéis descargar desde https://code.google.com/p/tesseract-ocr/ , aunque la imagen tiene que estar en formato TIFF para que sea reconocida.
El artículo lo puede leer en:
https://www.howtoforge.com/ocr_with_tesseract_on_ubuntu704

-
Software
- Top Ten de las innovaciones de Software Open Source.
- Real Player 11, graba todos los vídeos de Internet
- Reconocimiento Optico de Caracteres con Tesseract OCR en Ubuntu 7.04
- Cómo Instalar Linux en una PlayStation 3, (Colección de Manuales)
- GROUP-E, Software para la gestión de proyectos y trabajo en Grupo.
- Kazaa 5.0.0
- Cree un álbum de fotos con Project Zero & REST
- Instalar Ubuntu o Fedora, desde Windows.
- PDF es ahora la norma ISO 32000
- MikeOS 1.1 (Default)
- Necromancer's Dos Navigator el mejor clon del ''Norton Commander/Midnight Comman
- Usando LaTeX: Aspectos Básicos [parte I]