GuideQuantrium
Tesseract è un motore di riconoscimento ottico dei caratteri che può essere utilizzato su vari sistemi operativi. È un software libero, rilasciato sotto la licenza Apache. Originariamente, Tesseract è stato sviluppato da Hewlett-Packard come software proprietario negli anni ’80, poi è stato rilasciato come software open source nel 2005. Poi dal 2006, il suo sviluppo è stato sponsorizzato da Google. In questa guida, vi porterò attraverso i passi che ho seguito per installare Tesseract sulla mia macchina Windows 10. Vi mostrerò anche come potete usare tesseract dalla linea di comando una volta che l’avete installato con successo.
Per installare Tesseract 4 sul nostro sistema Windows, andate al seguente link:
Scaricate il file eseguibile di windows cliccando sull’hyper link intitolato tesseract-ocr-w64-setup-v4.1.0.20190314.exe. Apparirà una notifica che ti chiederà di salvare un file exe chiamato “Tesseract-ocr-w64-setup-v4.1.0.20190314.exe”. Salva questo file .exe ovunque tu abbia abbastanza spazio di archiviazione.
Apri questo file exe. Se la finestra ti chiede “Do you want to allow this software to make changes to your system”, clicca su yes. Sarai portato alla sezione di installazione.
Prendi Avanti, clicca su Accetto i termini e le condizioni e dopo aver selezionato per chi e tutto ciò che vuoi installare Tesseract (chiunque usi questo computer/solo per me. Puoi selezionare entrambi), clicca Avanti.
Spunta le caselle che dicono “ScrollView”, “Training Tools”, “Shortcuts creation” e, importante, “Language data”. Questi dovrebbero essere spuntati per impostazione predefinita, ma fatelo solo nel caso in cui non siano stati spuntati nel vostro sistema.
Ora, se volete fare previsioni in lingue straniere come giapponese, cinese, curdo o lingue indiane come hindi, tamil, bengali ecc, spuntate anche i “dati script aggiuntivi” e “dati lingua aggiuntivi”. Se vuoi fare previsioni solo per la lingua inglese, non devi spuntare questa opzione.
Clicca su Next. Seleziona la directory dove vuoi installare Tesseract. Di default mostra C:\Program Files\Tesseract-OCR
per me ed è lì che l’ho installato. Puoi installarlo come preferisci. Ma prendete nota del percorso in cui avete installato Tesseract sulla vostra macchina. Questo è importante.
Ora puoi selezionare la cartella del menu di avvio in cui vorresti creare il collegamento ai programmi. Io l’ho creato in una cartella chiamata “Tesseract-OCR”. Se lo vuoi in una nuova cartella, basta digitare il nome della cartella nello spazio vuoto proprio sotto il testo “Select the Start Menu folder in which you would like ….”.
Puoi anche spuntare la casella “Do not create shortcuts” in basso a sinistra se non vuoi creare alcun collegamento. Una volta che hai finito di selezionare la tua opzione preferita, clicca su installa. L’installazione dovrebbe durare qualche minuto.
Una volta che l’installazione è finita, vai nella directory dove hai installato Tesseract. Vogliamo usare Tesseract dalla nostra linea di comando di Windows e per farlo, dobbiamo aggiungere Tesseract al nostro percorso nella variabile d’ambiente del sistema.
Per farlo, cliccate sul pulsante start di Windows e cercate “variabile d’ambiente”. Vedrete un risultato chiamato “Modifica le variabili d’ambiente del sistema”. Cliccate su quello. Dopo aver cliccato su questo, dovresti essere nella sezione “Avanzate” di “Proprietà di sistema” e un pulsante chiamato “Variabili d’ambiente ….” dovrebbe essere visibile in basso a destra. Clicca su quel pulsante.
Ora, vedrai due tabelle qui. Una si chiama User variables for <username>
. Qui, il <username>
è una variabile che sta per il nome utente che usa il PC attualmente. L’altra tabella chiamata “Variabili di sistema”. Nella tabella “Variabili di sistema” clicca sulla variabile chiamata “Percorso” e poi clicca su questo pulsante chiamato “Modifica” proprio sopra il pulsante “OK” come mostrato nello screenshot qui sotto.