Installation och användning av Tesseract 4 på windows 10

Quantrium Guides

Bharath Sivakumar

Följ

8 juli, 2020 – 7 min read

Sätt sökvägsvariabel för Tesseract på Windows

När du är klar med detta kommer du att se en sida som heter ”Redigera miljövariabel”. Här uppe till höger ser du en knapp som heter ”New” (ny). Klicka på den där knappen ”New”. Du kommer att få ett tomt utrymme där du kan lägga till lite text. Här lägger du till ditt katalognamn där alla dina Tesseract-OCR-filer lagras.

När du har skrivit in katalognamnet trycker du på ”Enter” och kontrollerar om ditt katalognamn har lagts till i ”Edit environment variable table”. När det har gjorts klickar du på ”OK”. Klicka på OK igen på sidan ”Environment Variables” (miljövariabler). Klicka på ”OK” på sidan ”Systemegenskaper” igen. Du måste ha avslutat alla inställningsalternativ nu.

Öppna kommandotolken och skriv tesseract --version i kommandotolken och tryck på enter. Du kommer att se något som liknar detta:

Output för tesseract – versionskommandot efter att tesseract har installerats med framgång

Om du ser ett fel som tesseract command not found, så har du troligen gjort något misstag när du följde denna guide. Gå tillbaka och se var du har gjort fel och försök att rätta till det. Alternativt kan du upprepa hela processen igen.

Great! Nu har du installerat Tesseract på din maskin. Du kan börja leka med det och utforska det vidare.

Hur man använder Tesseract 4 med hjälp av kommandoraden på en Windows-maskin

Först ska du se till att du har ett handskrivet dokument eller ett maskinskrivet dokument i form av en bild. Låt oss säga att du har någon bild i png-form som heter handwritten_photo_1 på ditt skrivbord och vill testa Tesseract med den. Öppna kommandotolken. Du börjar i den här katalogen:

C:\Users\username>

där username är ditt användarnamn på det systemet. Jag måste gå till skrivbordskatalogen. Så jag använder följande kommando:

C:\Users\username> cd Desktop

Nu är jag i skrivbordskatalogen, där min bild finns. Du kan se vad Tesseract förutspår för text i dokumentet genom att använda följande kommando:

C:\Users\username\Desktop> tesseract handwritten_photo_1.png stdout -l eng

Tesseract ger ut texten direkt i själva kommandoraden. Parametern -l används för att ange språket. Här har vi angett det som engelska, vilket ändå är standard, så att använda -l eng var överflödigt i det här fallet. Om du vill använda något annat språk för OCR kan du kontrollera den här länken som innehåller alla .traineddata-filer som anger språket:

Säg att du har ett textdokument som är skrivet på hindi. Gå då till den här länken ovan, klicka på filen med titeln hin.traineddata och ladda ner den. När du har laddat ner den måste du flytta till mappen ”tessdata”, som kommer att finnas i den katalog där du ursprungligen hade installerat tesseract. När du har gjort det kan du utföra OCR av Hindi-dokument med hjälp av följande kommando:

C:\Users\username\Desktop> tesseract hindi_image.png stdout -l hin

Istället för att visa OCR-utmatningen på själva kommandoraden, låt oss säga att du vill att din OCR-utmatning ska lagras i en textfil. I det fallet kan du i stället ange följande kommando:

tesseract handwritten_photo_1.png output.txt

Texten i handwritten_photo_1.png kommer att lagras i en textfil med namnet output.txt som kommer att ligga i din nuvarande arbetskatalog, vilket i mitt fall var Desktop.

Tesseract kan också ta en textfil som indata, där texten måste innehålla alla absoluta sökvägar till de bilder som du vill bearbeta.

Detta är särskilt användbart när, låt oss säga att du har två bilder handskrivna på engelska som heter handwritten_photo_1.png och handwritten_photo_2.png i katalogen C:\Program Files. I din nuvarande arbetskatalog har du nu en textfil som heter input.txt vars innehåll är:

C:\Program Files\handwritten_photo_1.png
C:\Program Files\handwritten_photo_2.png

I den första respektive andra raden.

Om du nu vill lagra innehållet i de här två handskrivna bilderna i en textfil kan du bara göra följande:

tesseract input.txt output.txt -l eng

output.txt kommer att ha OCR-innehållet i både handwritten_photo_1.png och handwritten_photo_2.png, i den ordningen. Här bör du notera att input.txt fanns i den aktuella arbetskatalogen. Du kan använda tesseract på en textfil som inte heller finns i din nuvarande arbetskatalog genom att inkludera katalogplatsen som här:

tesseract C:\Program Files\input.txt output.txt -l eng

output.txt kommer återigen att finnas i den nuvarande arbetskatalogen. Du kan också göra detta för mer än två bilder. Observera att förutsägelsen för ett nytt foto i output.txt-filen kommer att föregås av någon symbol som t.ex:

Tesseract-utgång av en inmatningstextfil med 5 rader med bildplatser

Så i det här fallet är Viral Calic förutsägelsen för den första bilden, CY am the king of the world förutsägelsen för den andra bilden, Com and Serr förutsägelsen för den tredje bilden och så vidare. Du kan kontrollera resultatet för alla dina inmatade bilder och kontrollera förutsägelsernas noggrannhet.

Det var allt! Grattis, du är nu redo att använda Tesseract på ditt Windows 10-system.

Quantrium Guides

Hur man använder Tesseract 4 med hjälp av kommandoraden på en Windows-maskin

Lämna ett svar Avbryt svar