Quantrium útmutatók
Ha ezzel végzett, megjelenik a “Edit environment variable” nevű oldal. Itt a jobb felső sarokban egy “Új” nevű gombot fogsz látni. Kattints erre az “Új” gombra. Kapsz egy üres helyet, ahol hozzáadhatsz egy kis szöveget. Ide írja be a könyvtár nevét, ahol az összes Tesseract-OCR fájlját tárolja.
Amikor beírta a könyvtár nevét, nyomja meg az “Enter”-t, és ellenőrizze, hogy a könyvtár neve bekerült-e a “Környezeti változó szerkesztése táblázatba”. Ha ez megtörtént, kattintson az “OK” gombra. Kattintson ismét az OK gombra a “Környezeti változók” oldalon. Kattintson ismét az “OK” gombra a “Rendszer tulajdonságai” oldalon. Most már minden beállítási lehetőségből ki kell lépnie.
Nyissa meg a parancssort, és írja be a tesseract --version
parancsot a parancssorba, majd nyomja meg az Entert. Valami ilyesmit fog látni:
Ha bármilyen hibát lát, mint tesseract command not found
, akkor valószínűleg valamilyen hibát követett el az útmutató követése során. Menjen vissza, és nézze meg, hol rontotta el, és próbálja meg kijavítani. Alternatívaként megismételheti az egész folyamatot újra.
Nagyszerű! Most már telepítette a Tesseractot a gépére. Elkezdhetsz vele játszani és tovább vizsgálódni.
Hogyan használd a Tesseract 4-et parancssor segítségével Windows gépen
Először is, győződj meg róla, hogy van valamilyen kézzel írt dokumentumod vagy valamilyen gépelt dokumentumod kép formájában. Tegyük fel, hogy van valamilyen png formátumú fényképed handwritten_photo_1
néven az asztalon, és ezzel szeretnéd tesztelni a Tesseractot. Nyissa meg a parancssorát. Ebben a könyvtárban fogsz indulni:
C:\Users\username>
ahol username
a felhasználóneved az adott rendszeren. Az asztali könyvtárba kell mennem. Ezért a következő parancsot használom:
C:\Users\username> cd Desktop
Most már az Asztal könyvtárban vagyok, ahol a képem található. A következő paranccsal láthatjuk, hogy a Tesseract mit jósol a dokumentumban lévő szövegnek:
C:\Users\username\Desktop> tesseract handwritten_photo_1.png stdout -l eng
A Tesseract közvetlenül magában a parancssorban adja ki a szöveget. A -l
paraméter a nyelv megadására szolgál. Itt angolul adtuk meg, ami alapértelmezés szerint amúgy is így van, így a -l eng
használata ebben az esetben felesleges volt. Ha más nyelvet szeretne használni az OCR-hez, nézze meg ezt a linket, amely tartalmazza az összes .traineddata
fájlt, amely meghatározza a nyelvet:
Tegyük fel, hogy van egy hindi nyelven írt szöveges dokumentum. Ezután lépjen erre a fenti linkre, kattintson a hin.traineddata
című fájlra, és töltse le. Miután letöltötte, át kell helyeznie a “tessdata” mappába, amely a tesseract eredeti telepítési helyének könyvtárában lesz. Miután ezt megtette, a következő paranccsal végezheti el a hindi dokumentumok OCR-felismerését:
C:\Users\username\Desktop> tesseract hindi_image.png stdout -l hin
Ahelyett, hogy az OCR-kimenetet magában a parancssorban jelenítené meg, tegyük fel, hogy az OCR-kimenetet egy szöveges fájlban szeretné tárolni. Ebben az esetben a következő parancsot adhatja be helyette:
tesseract handwritten_photo_1.png output.txt
A handwritten_photo_1.png
-ban lévő szöveget egy output.txt
nevű szöveges fájlban fogja tárolni, amely a jelenlegi munkakönyvtárában lesz, ami az én esetemben az Asztal volt.
A Tesseract egy szöveges fájlt is elfogadhat bemenetként, ahol a szövegnek tartalmaznia kell a feldolgozni kívánt képek összes abszolút elérési útvonalát.
Ez különösen akkor hasznos, ha, mondjuk, két kézzel írt angol nyelvű képed van handwritten_photo_1.png
és handwritten_photo_2.png
néven a C:\Program Files
könyvtárban. Most a jelenlegi munkakönyvtáradban van egy input.txt
nevű szövegfájlod, amelynek tartalma:
C:\Program Files\handwritten_photo_1.png
C:\Program Files\handwritten_photo_2.png
Az első és a második sorban.
Ha most ennek a két kézzel írt képnek a tartalmát akarod egy szövegfájlban tárolni, akkor csak a következőt kell tenned:
tesseract input.txt output.txt -l eng
output.txt
mind a handwritten_photo_1.png
és handwritten_photo_2.png
OCR tartalmát tartalmazza, ebben a sorrendben. Itt érdemes megjegyezni, hogy a input.txt
az aktuális munkakönyvtárban volt. A tesseractot használhatja olyan szövegfájlra is, amely nem a jelenlegi munkakönyvtárban van, ha a könyvtár helyét is megadja, mint itt:
tesseract C:\Program Files\input.txt output.txt -l eng
output.txt
ismét a jelenlegi munkakönyvtárban lesz. Ezt kettőnél több fotó esetében is megteheti. Vegye figyelembe, hogy a output.txt
fájlban lévő új fotó előrejelzését valamilyen szimbólum fogja megelőzni, mint:
Ez esetben tehát Viral Calic
az első kép előrejelzése, CY am the king of the world
a második kép előrejelzése, Com and Serr
a harmadik kép előrejelzése és így tovább. Ellenőrizheti a kimenetet az összes bemeneti képre, és ellenőrizheti a jóslatok pontosságát.
Ez az! Gratulálunk, most már minden készen áll, és készen áll a Tesseract használatára a Windows 10 rendszerén.