A Tesseract 4 telepítése és használata windows 10 alatt

Quantrium útmutatók

Bharath Sivakumar

Júl 8, 2020 – 7 min olvasni

Set path variable for Tesseract on Windows

Ha ezzel végzett, megjelenik a “Edit environment variable” nevű oldal. Itt a jobb felső sarokban egy “Új” nevű gombot fogsz látni. Kattints erre az “Új” gombra. Kapsz egy üres helyet, ahol hozzáadhatsz egy kis szöveget. Ide írja be a könyvtár nevét, ahol az összes Tesseract-OCR fájlját tárolja.

Amikor beírta a könyvtár nevét, nyomja meg az “Enter”-t, és ellenőrizze, hogy a könyvtár neve bekerült-e a “Környezeti változó szerkesztése táblázatba”. Ha ez megtörtént, kattintson az “OK” gombra. Kattintson ismét az OK gombra a “Környezeti változók” oldalon. Kattintson ismét az “OK” gombra a “Rendszer tulajdonságai” oldalon. Most már minden beállítási lehetőségből ki kell lépnie.

Nyissa meg a parancssort, és írja be a tesseract --version parancsot a parancssorba, majd nyomja meg az Entert. Valami ilyesmit fog látni:

Output for tesseract – version command after tesseract was successfully installed

Ha bármilyen hibát lát, mint tesseract command not found, akkor valószínűleg valamilyen hibát követett el az útmutató követése során. Menjen vissza, és nézze meg, hol rontotta el, és próbálja meg kijavítani. Alternatívaként megismételheti az egész folyamatot újra.

Nagyszerű! Most már telepítette a Tesseractot a gépére. Elkezdhetsz vele játszani és tovább vizsgálódni.

Hogyan használd a Tesseract 4-et parancssor segítségével Windows gépen

Először is, győződj meg róla, hogy van valamilyen kézzel írt dokumentumod vagy valamilyen gépelt dokumentumod kép formájában. Tegyük fel, hogy van valamilyen png formátumú fényképed handwritten_photo_1 néven az asztalon, és ezzel szeretnéd tesztelni a Tesseractot. Nyissa meg a parancssorát. Ebben a könyvtárban fogsz indulni:

C:\Users\username>

ahol username a felhasználóneved az adott rendszeren. Az asztali könyvtárba kell mennem. Ezért a következő parancsot használom:

C:\Users\username> cd Desktop

Most már az Asztal könyvtárban vagyok, ahol a képem található. A következő paranccsal láthatjuk, hogy a Tesseract mit jósol a dokumentumban lévő szövegnek:

C:\Users\username\Desktop> tesseract handwritten_photo_1.png stdout -l eng

A Tesseract közvetlenül magában a parancssorban adja ki a szöveget. A -l paraméter a nyelv megadására szolgál. Itt angolul adtuk meg, ami alapértelmezés szerint amúgy is így van, így a -l eng használata ebben az esetben felesleges volt. Ha más nyelvet szeretne használni az OCR-hez, nézze meg ezt a linket, amely tartalmazza az összes .traineddata fájlt, amely meghatározza a nyelvet:

Tegyük fel, hogy van egy hindi nyelven írt szöveges dokumentum. Ezután lépjen erre a fenti linkre, kattintson a hin.traineddata című fájlra, és töltse le. Miután letöltötte, át kell helyeznie a “tessdata” mappába, amely a tesseract eredeti telepítési helyének könyvtárában lesz. Miután ezt megtette, a következő paranccsal végezheti el a hindi dokumentumok OCR-felismerését:

C:\Users\username\Desktop> tesseract hindi_image.png stdout -l hin

Ahelyett, hogy az OCR-kimenetet magában a parancssorban jelenítené meg, tegyük fel, hogy az OCR-kimenetet egy szöveges fájlban szeretné tárolni. Ebben az esetben a következő parancsot adhatja be helyette:

tesseract handwritten_photo_1.png output.txt

A handwritten_photo_1.png-ban lévő szöveget egy output.txt nevű szöveges fájlban fogja tárolni, amely a jelenlegi munkakönyvtárában lesz, ami az én esetemben az Asztal volt.

A Tesseract egy szöveges fájlt is elfogadhat bemenetként, ahol a szövegnek tartalmaznia kell a feldolgozni kívánt képek összes abszolút elérési útvonalát.

Ez különösen akkor hasznos, ha, mondjuk, két kézzel írt angol nyelvű képed van handwritten_photo_1.png és handwritten_photo_2.png néven a C:\Program Files könyvtárban. Most a jelenlegi munkakönyvtáradban van egy input.txt nevű szövegfájlod, amelynek tartalma:

C:\Program Files\handwritten_photo_1.png
C:\Program Files\handwritten_photo_2.png

Az első és a második sorban.

Ha most ennek a két kézzel írt képnek a tartalmát akarod egy szövegfájlban tárolni, akkor csak a következőt kell tenned:

tesseract input.txt output.txt -l eng

output.txt mind a handwritten_photo_1.png és handwritten_photo_2.png OCR tartalmát tartalmazza, ebben a sorrendben. Itt érdemes megjegyezni, hogy a input.txt az aktuális munkakönyvtárban volt. A tesseractot használhatja olyan szövegfájlra is, amely nem a jelenlegi munkakönyvtárban van, ha a könyvtár helyét is megadja, mint itt:

tesseract C:\Program Files\input.txt output.txt -l eng

output.txt ismét a jelenlegi munkakönyvtárban lesz. Ezt kettőnél több fotó esetében is megteheti. Vegye figyelembe, hogy a output.txt fájlban lévő új fotó előrejelzését valamilyen szimbólum fogja megelőzni, mint:

Tesseract kimenete egy 5 soros képhelyeket tartalmazó bemeneti szövegfájlból

Ez esetben tehát Viral Calic az első kép előrejelzése, CY am the king of the world a második kép előrejelzése, Com and Serr a harmadik kép előrejelzése és így tovább. Ellenőrizheti a kimenetet az összes bemeneti képre, és ellenőrizheti a jóslatok pontosságát.

Ez az! Gratulálunk, most már minden készen áll, és készen áll a Tesseract használatára a Windows 10 rendszerén.

Quantrium útmutatók

Hogyan használd a Tesseract 4-et parancssor segítségével Windows gépen

Vélemény, hozzászólás? Kilépés a válaszból