OCR è la sigla che sta per Optical Character Recognition, ovvero il riconoscimento ottico dei caratteri, si tratta in pratica di un software in grado di interpretare un documento scansionato ed estrapolarne il testo per renderlo modificabile tramite un normale programma di videoscrittura.
In questa pagina vengono proposti i migliori programmi OCR gratuiti.
FreeOCR
FreeOCR è scaricabile da questo indirizzo (individuare la sezione download nella pagina), per funzionare con la lingua italiana è necessario scaricare un ulteriore pacchetto, prelevabile da qui, nella pagina individuare il file tesseract-2.00.ita.tar.gz - Italian language data for Tesseract (2.00 and up), scaricarlo ed estrarlo con un programma come WinRAR o 7-Zip nella cartella di Windows (FreeOCR durante l'installazione crea una nuova cartella nominata tessdata sotto la cartella principale di Windows, es.: C:\Windows\tessdata), è importante che in questa cartella siano presenti tutti i file estratti necessari per la lingua italiana, identificabili facilmente dal nome (ita.xxx), vedi immagine:
Dal programma FreeOCR selezionare ita dal menù a tendina OCR Language, scansionare un documento (si consiglia ad almeno 200 dpi di risoluzione) oppure aprirne uno già scansionato in precedenza, tramite il pulsante OCR iniziare la procedura di riconoscimento ottico dei caratteri, nella finestra di destra viene mostrato il testo riconosciuto che potrà essere copiato e incollato in qualsiasi programma di videoscrittura.
Nell'esempio è stato stampata una pagina da Wikipedia inerente alla tecnologia OCR, successivamente è stata scansionata a 300 dpi e importata in FreeOCR, il programma ha riconosciuto in maniera eccellente il testo producendo qualche piccolo errore (in ogni caso è sempre bene controllare il testo e sottoporlo ad un controllo ortografico del proprio programma di videoscrittura.
Altri programmi OCR gratuiti: