gImageReader, OCR क्षमतेसह PDF अनुप्रयोग

पुढच्या लेखात आपण जिमॅजॅरीडरकडे एक नजर टाकणार आहोत. हे एक अॅप आहे इंजिनसाठी पुढील टोक टेस्क्रॅक्ट ओसीआर. ज्यांना टेस्क्रॅक्ट माहित नाही त्यांच्यासाठी असे म्हणा की हे ऑप्टिकल कॅरेक्टर रिकग्निशन (ओसीआर) इंजिन आहे जे प्रतिमांवर छापलेले मजकूर शोधण्यासाठी आणि ओळखण्यासाठी कृत्रिम बुद्धिमत्ता वापरते. हे एक ओपन सोर्स लायब्ररी आहे आणि बाजारातील सर्वात लोकप्रिय ओसीआर इंजिन आहे. प्रतिमांमधून मुद्रित मजकूर काढण्याची संपूर्ण प्रक्रिया सुलभ करा वापरकर्त्यांना फायली, स्कॅन केलेल्या प्रतिमा, पीडीएफ, पेस्ट केलेल्या क्लिपबोर्ड आयटम इ. सह कार्य करण्यास अनुमती देते.

आज सर्व वापरकर्ते, कार्यालये, घरे इत्यादी असोत, आपण स्वतःला अशा परिस्थितीत शोधू शकतो ज्यामध्ये प्रतिमेतून मजकूर काढायचा आहे. हे प्रतिमेमध्ये स्कॅन केलेले कागदजत्र, कागदाचा तुकडा किंवा एखादा जुना शोधनिबंध असू शकेल. संपादक वापरून सर्व मजकूर टाइप करणे हा बर्‍याच वापरकर्त्यांचा पर्याय असेल, परंतु ही प्रक्रिया वेळ घेणारी असू शकते. हे काम टाळण्यासाठी, आम्ही पर्याय निवडू शकतो मजकूर स्वयंचलितपणे काढण्यासाठी ओसीआर वापरा.

gImageReader आम्हाला बर्‍याच फंक्शन्स आणि टूल्स देईल. आयात केल्यानंतर हा अनुप्रयोग वापरण्यासाठी एक चांगले साधन आहे PDF किंवा स्कॅन केलेला दस्तऐवज आणि त्याची पुढील प्रक्रिया.

GImageReader सामान्य वैशिष्ट्ये

आम्ही सक्षम होऊ डिस्क, स्कॅनिंग डिव्हाइस, क्लिपबोर्ड आणि स्क्रीनशॉट वरून पीडीएफ दस्तऐवज आणि प्रतिमा आयात करा. gImageReader अनेक प्रकारच्या फायली समर्थित करते. आपल्याला फक्त आमच्या फाईल्स टूलवर आणि आयात कराव्या लागतील एका क्लिकवर मजकूर काढा.
आम्ही शक्यता आहे एचओसीआर कागदपत्रांमधून पीडीएफ दस्तऐवज व्युत्पन्न करा. gImageReader काढलेल्या मजकूराचे तीन स्वरूप, साध्या मजकूर, पीडीएफ आणि hOCR स्वरूपनास समर्थन देते.
साधन आम्हाला शक्यता देते मॅन्युअल किंवा स्वयंचलित ओळख क्षेत्र परिभाषित करा काढण्यासाठी मजकूर निवडण्यासाठी.
प्रतिमेवरील थेट प्रदर्शित केलेला मजकूर. आपण वरील स्क्रीनशॉटमध्ये पाहू शकता.
साध्या मजकूरात काढल्यानंतर, gImageReader पोस्ट-प्रोसेसिंग क्रिया करतो, जसे की शब्दलेखन तपासणी. आम्ही निवडलेल्या भाषेनुसार (डीफॉल्ट ऑल इंग्लिश आहे), व्याकरणात्मक त्रुटी असलेले शब्द अधोरेखित करेल. याव्यतिरिक्त, जीमॅजॅरीडर आम्हाला काढलेल्या मजकूरासाठी वापरू इच्छित असलेले पृष्ठ सेगमेंटेशन मोड निवडण्याची परवानगी देतो.
इतर ओसीआर टूल्सच्या विपरीत जिथे आम्ही एकाच वेळी एका फाईलसह कार्य करू शकतो, जिमॅजेरायडर त्यास समर्थन देतो असंख्य फायली आणि त्यांच्या बॅच प्रक्रिया आयातs.

या प्रोग्राम बद्दल आम्ही करू शकतो त्यांच्या अधिकृत पृष्ठावरील अधिक माहिती किंवा कोणतेही नवीन अद्यतन मिळवा GitHub.

उबंटू वर स्थापना

हे एक आहे क्रॉस प्लॅटफॉर्म अनुप्रयोग आणि हे दोन्ही Gnu / Linux आणि Windows वर कार्य करते. खालील ओळींमध्ये आम्ही उबंटू 18.04 मध्ये दर्शविल्याप्रमाणे जिमॅजेराएडर स्थापना प्रक्रिया दिसेल प्रोजेक्टचे गिटहब पृष्ठ.

पीपीए जोडा

हे सॉफ्टवेअर घेण्यासाठी आम्हाला आवश्यक आहे आमच्या सिस्टममध्ये पीपीए रेपॉजिटरी जोडा. टर्मिनल (Ctrl + Alt + T) उघडून पुढील कमांड टाइप करुन हे करू.

sudo add-apt-repository ppa:sandromani/gimagereader

GImageReader स्थापित करा

सॉफ्टवेअर अद्यतन उपलब्ध झाल्यानंतर, आम्ही आता करू शकतो अनुप्रयोग स्थापित करण्यासाठी पुढे जा समान टर्मिनलमध्ये टाइप करणे:

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

वरील सर्व गोष्टींबरोबरच, गिबाज रीडरने आपल्या उबंटूवर स्थापित केले पाहिजे. आता आपण आपल्या संगणकावर प्रोग्राम सुरू करण्यास सक्षम आहोत.

विस्थापित करा

जर आम्हाला हवे असेल gImageReader विस्थापित कराटर्मिनलमध्ये (Ctrl + Alt + T) आपल्याला फक्त पुढील आदेश वापरावे लागतील:

sudo apt-get remove gimagereader -y

प्रोग्राम काढून टाकण्यासाठी आम्ही कार्यान्वित करू शकतो:

sudo apt-get autoremove

आम्ही स्थापनेसाठी वापरत असलेला पीपीए समान टर्मिनलमध्ये टाइप करून आमच्या सिस्टममधून काढला जाऊ शकतो:

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader एक सोपा आहे फ्रंट-एंड Gtk / Qt for टेसेरेक्ट-ओसीआर हे प्रतिमांमधून मुद्रित मजकूर काढण्याची संपूर्ण प्रक्रिया सुलभ करते. हे आम्हाला फायली, स्कॅन केलेल्या प्रतिमा, पीडीएफ, पेस्ट केलेल्या क्लिपबोर्ड आयटम इत्यादीसह कार्य करण्यास अनुमती देईल. आमच्या प्रतिमांमधून मजकूर सहज आणि द्रुतपणे मिळविणे हे एक चांगला पर्याय बनवते.

आपली टिप्पणी द्या उत्तर रद्द करा

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

टिप्पणी *

नाव*

Correo electrónico*

मी स्वीकारतो गोपनीयता अटी*

डेटा जबाबदार: मिगुएल Áन्गल गॅटन
डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
कायदे: आपली संमती
डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.

मला वृत्तपत्र प्राप्त करायचे आहे

Ubunlog

gImageReader, एक OCR- सक्षम पीडीएफ अनुप्रयोग