venerdì 9 aprile 2010

OCR gratis: i migliori programmi e servizi Online

dA-List #1:

migliori programmi

e

servizi OCR gratuiti

Tramite il riconoscimento ottico dei caratteri (OCR) è possibile convertire pagine contenenti testo da formato grafico (scansioni o file grafici) a formato testo editabile. I vantaggi sono il fatto di poter visualizzare e modificare i documenti con qualunque editor di testo (Word, Powerpoint, OpenOffice, Notepad, etc) ed il "peso" del documento testo (KB / MB), di gran lunga inferiore all'originale.
I pacchetti commerciali di riferimento sono, da tempo, Omnipage, FineReader, ReadIris e TextBridgeI costi di questi applicativi,  seppur differenziati nelle varie versioni,  risultano elevati per un uso saltuario o domestico.
Anche nel campo dell'OCR, se non si hanno particolari pretese di qualità, negli ultimi anni si è creata un'offerta di applicativi e servizi online di OCR gratuiti.
L' accuratezza del riconoscimento dipende molto anche anche dalla qualità e dalla risoluzione (meglio se almeno 200dpi ) dell'immagine o della scansione dell'originale.
In generale gli attuali prodotti Free ancora non si avvicinano alle prestazioni dei software commerciali; in particolare per quanto riguarda il mantenere la formattazione originale (es. colonne, tabelle, immagini, testi), il supporto multilingua e riconoscere testi obliqui o font particolari.

Se l'esigenza è meramente di riconoscere il testo per poi (ri)formattarlo a nostro piacimento, gli applicativi gratuiti vanno più che bene.

Segnalateci eventuali software o servizi OCR mancanti e meritevoli di inserimento nella lista.
Anche il feedback sui programmi elencati è sempre benvenuto

Eccovi dunque il meglio attualmente disponibile tra le soluzioni OCR a costo zero.


A) Non sapete di averlo (ma avete già un programma OCR):
Microsoft Office Digital Imaging
In tutte le versioni di Microsoft Office, da Office XP ad Office 2007, è incluso Microsoft Office Digital Imaging, un buon applicativo di OCR in grado di convertire pagine da formato TIF a documenti Word (testo ed immagini).
Il motivo per cui la grande maggioranza degli utenti Office non è a conoscenza di questo programma  è il fatto che non viene installato automaticamente insieme agli altri programmi di Office.
Occorre richiederne esplicitamente l'installazione: in pannello di controllo, installazione programmi, avviate l'installazione di Office (modifica/aggiungi) e selezionate, negli strumenti di Office (Office Tools) il componente Digital Imaging.

Conclusa l'installazione (che tipicamente non richiede nemmeno di reinserire il CD di installazione),  potete avviare il programma da menu, come in figura.


L'applicativo è molto facile da usare:
caricate il file TIF che contiene le pagine da riconoscere, cliccate sull'icona con l'occhio per avviare il riconoscimento ed infine cliccate sull'icona Word a fianco per aprire il testo riconosciuto in Word.



B) Software gratuito in Bundle
Se possedete uno scanner oppure una stampante multifunzione è probabile che in dotazione ci sia anche un programma di OCR. E' solitamente una versione "light" di un pacchetto commerciale: verificate sui CD di installazione e sul sito del produttore tra i driver o download specifici per il vostro modello.
HP, Canon, Epson e Lexmark sono solo alcuni dei vendor che comunemente offrono software OCR gratis in bundle con le loro periferiche.

C) Freeware OCR


FreeOCR v3.0
Programma Windows per la scansione e per l'OCR; completamente gratuito anche per uso commerciale.
Si basa sul motore di ocr gratuito Tesseract, rilasciato da Google ed inizialmente sviluppato dai laboratori Hewlett Packard tra il  1985 ed il 1995.
Supporta file PDF, TIF ed i più diffusi formati grafici. E' compatibile con lo standard TWAIN per la gestione degli scanner.


Simple OCR


Altro applicativo Windows, consente anch'esso di acquisire pagine da scanner compatibili TWAIN.  SimpleOCR consente di impostare le zone di testo da convertire.
Offre anche un periodo di prova per il riconoscimento di testi scritti a mano.
I documenti Testo generati si possono salvare in formato TXT ed RTF (compatibile con tutti i programmi di Word Processing).
Il software è gratuito per uso non commerciale.


PDF OCR

In ambiente Windows converte scansioni di testi / libri da formato PDF a file di testo. PDF OCR è dotato di un editor di testo integrato per poter modificare il testo risultante senza necessitare di  Word o simili. Supporta anche modalità batch.


Top OCR
Programma sviluppato specificamente per l'OCR di immagini scattate con macchine fotografiche digitali e smartphone. Gli sviluppatori di Top OCR affermano che supporta il riconoscimento di testi in 11 lingue, italiano compreso.

D) Servizi OCR Online Gratuiti






Free OCR
Servizio a free online per l'OCR (Optical Character Recognition).
Non richiede registrazione o indirizzi mail.
Consente il caricamento di file JPG, GIF, TIFF BMP o PDF (non supporta i PDF multipagina).

Limitazioni: 2 MB di dimensione massima immagine, non più larga o alta di 5000 pixel, massimo 10 immagini all'ora.

Free-OCR riconosce correttamente eventuali colonne di testo; il risultato è un testo non formattato e dunque l'ordine del testo in colonne riconosciuto è corretto ma le colonne, in termini di formattazione, vengono perse. Ampio Supporto Multilingua, Italiano incluso
Sul sito è indicata anche la politica di privacy in relazione ai file inviati: vengono cancellati dopo la conversione.





New OCR
Ulteriore Servizio OCR online che non richiede registrazione.
La pagina web ed i risultati dell'OCR sono molto simili al precedente servizio; tanto da far pensare che sia lo stesso motore OCR se non la stessa società.
La differenza è che New OCR supporta i PDF multipagina ed i limiti di peso più ampi (20 MB per i PDF e 5 MB per gli altri formati). Non vi sono indicazioni relative alla Privacy.




OCR Terminal
Servizio online; richiede registrazione. Le prime 20 pagine al mese sono gratuite.
Consente anche di convertire file da PDF a Word. Il servizio OCR accetta file in input nei formati  PDF, TIF, JPG, BMP, PNG e GIF.
Il risultato può essere generato in formato Microsoft Word e PDF. Non abbiamo avuto modo di verificare ma il sito sostiene che la formattazione del documento originale viene fedelmente mantenuta.



(C) 2010 proprinting.blogspot.com
Note / Disclaimer: l'autore non si assume alcuna responsabilità per eventuali danni diretti o indiretti o perdita dati derivanti dall'uso dei software  e servizi sopra citati o da eventuali indicazioni errate. Tutti i marchi sono dei rispettivi proprietari.  L'autore non ha alcun legame con  marchi, siti e software citati.

Nessun commento:

Posta un commento