gImageReader, egy OCR-képességekkel rendelkező PDF-alkalmazás

A következő cikkben a gImageReaderrel fogunk foglalkozni. Ez egy alkalmazás eleje a motornak Tesseact OCR. Azok számára, akik nem ismerik a Tesseract-ot, mondják el, hogy ez egy optikai karakterfelismerő (OCR) motor, amely mesterséges intelligenciát használ a képekre nyomtatott szöveg keresésére és felismerésére. Ez egy nyílt forráskódú könyvtár és az egyik legnépszerűbb OCR motor a piacon. Egyszerűsítse a nyomtatott szöveg képekből történő kinyerésének teljes folyamatát lehetővé teszi a felhasználók számára, hogy fájlokkal, beolvasott képekkel, PDF-ekkel, beillesztett vágólap-elemekkel stb. dolgozzanak.

Manapság minden felhasználó, legyen az irodában, otthonában stb., olyan helyzetbe kerülhet, hogy szöveget kell kinyernünk egy képből. Ez lehet egy beszkennelt dokumentum képformátumban, egy darab papír vagy egy régi kutatómunka. Sok felhasználó azt a lehetőséget választaná, hogy az összes szöveget egy szerkesztő segítségével írja be, de ez a folyamat időigényes lehet. Ennek elkerülése érdekében választhatjuk a lehetőséget is használjon OCR-t a szöveg automatikus kibontásához.

A gImageReader számos funkciót és eszközt kínál majd számunkra. Ez az alkalmazás egy jó eszköz az importálás után a PDF illetve a beszkennelt dokumentum és annak további feldolgozása.

A GImageReader általános szolgáltatásai

Képesek leszünk PDF dokumentumok és képek importálása lemezről, szkennelő eszközökről, vágólapról és képernyőképekről. A gImageReader számos fájltípust támogat. Egyszerűen importálnunk kell fájljainkat az eszközbe és szöveg kibontása egyetlen kattintással.
Lehetőségünk lesz rá PDF dokumentumokat hozhat létre a hOCR dokumentumokból. A gImageReader a kivonatolt szöveg, az egyszerű szöveg, a PDF és a hOCR formátum három formátumát támogatja.
Az eszköz lehetőséget ad nekünk arra definiáljon egy kézi vagy automatikus felismerési területet a kibontandó szöveg kiválasztásához.
A felismert szöveg közvetlenül a kép mellett jelenik meg. Ahogy a fenti képernyőképen is látható.
Az egyszerű szöveggé történő kibontás után a gImageReader utófeldolgozási műveleteket hajt végre, mint pl helyesírás-ellenőrzés. Az általunk választott nyelvtől függően (az alapértelmezett az All English), aláhúzza a nyelvtani hibákat tartalmazó szavakat. Ezenkívül a gImageReader lehetővé teszi, hogy kiválasszuk azt az oldalszegmentálási módot, amelyet a kivonatolt szöveghez szeretnénk használni.
Más OCR-eszközökkel ellentétben, ahol egyszerre csak egy fájllal dolgozhatunk, a gImageReader támogatja a számos fájl importálása és kötegelt feldolgozáss.

Erről a programról tudunk további információkat vagy bármilyen új frissítést kaphat hivatalos oldalukon GitHub.

Telepítés az Ubuntu-ra

Ez egy platformok közötti alkalmazás és Gnu/Linux és Windows alatt is működik. A következő sorokban látni fogjuk a gImageReader telepítési folyamatát az Ubuntu 18.04-ben, amint azt a a projekt GitHub oldalán.

Adja hozzá a PPA-t

Ehhez a szoftverhez szükségünk lesz adja hozzá a PPA-tárat a rendszerünkhöz. Ezt úgy fogjuk megtenni, hogy megnyitunk egy terminált (Ctrl + Alt + T), és beírjuk a következő parancsot:

sudo add-apt-repository ppa:sandromani/gimagereader

Telepítse a gImageReader programot

A rendelkezésre álló szoftverfrissítés után most már tudjuk folytassa az alkalmazás telepítését gépelés ugyanabba a terminálba:

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

A fentiek mindegyikével a gImageReader telepítenie kell az Ubuntu-t. Most már képesnek kell lennünk a program elindítására a számítógépünkön.

eltávolítást

Ha szeretnénk távolítsa el a gImageReader alkalmazástEgy terminálban (Ctrl + Alt + T) csak a következő parancsot kell használnunk:

sudo apt-get remove gimagereader -y

A program kiküszöbölése érdekében végrehajthatjuk:

sudo apt-get autoremove

A telepítéshez használt PPA kiküszöbölhető a rendszerünkből, ha beírja ugyanabba a terminálba:

sudo add-apt-repository -r ppa:sandromani/gimagereader

A gImageReader egy egyszerű front-end Gtk / Qt for tesseract-ocr Ez leegyszerűsíti a nyomtatott szöveg képekből történő kinyerésének teljes folyamatát. Lehetővé teszi számunkra, hogy dolgozzunk fájlokkal, beolvasott képekkel, PDF-ekkel, beillesztett vágólap-elemekkel stb. Ez jó lehetőséget kínál arra, hogy egyszerűen és gyorsan kiszedjük a szöveget a képeinkből.

Ubunlog

gImageReader, egy OCR-képes PDF-alkalmazás

A GImageReader általános szolgáltatásai

Telepítés az Ubuntu-ra

Adja hozzá a PPA-t

Telepítse a gImageReader programot

eltávolítást

Hagyja megjegyzését Mégsem válaszát