पुढच्या लेखात आपण जिमॅजॅरीडरकडे एक नजर टाकणार आहोत. हे एक अॅप आहे इंजिनसाठी पुढील टोक टेस्क्रॅक्ट ओसीआर. ज्यांना टेस्क्रॅक्ट माहित नाही त्यांच्यासाठी असे म्हणा की हे ऑप्टिकल कॅरेक्टर रिकग्निशन (ओसीआर) इंजिन आहे जे प्रतिमांवर छापलेले मजकूर शोधण्यासाठी आणि ओळखण्यासाठी कृत्रिम बुद्धिमत्ता वापरते. हे एक ओपन सोर्स लायब्ररी आहे आणि बाजारातील सर्वात लोकप्रिय ओसीआर इंजिन आहे. प्रतिमांमधून मुद्रित मजकूर काढण्याची संपूर्ण प्रक्रिया सुलभ करा वापरकर्त्यांना फायली, स्कॅन केलेल्या प्रतिमा, पीडीएफ, पेस्ट केलेल्या क्लिपबोर्ड आयटम इ. सह कार्य करण्यास अनुमती देते.
आज सर्व वापरकर्ते, कार्यालये, घरे इत्यादी असोत, आपण स्वतःला अशा परिस्थितीत शोधू शकतो ज्यामध्ये प्रतिमेतून मजकूर काढायचा आहे. हे प्रतिमेमध्ये स्कॅन केलेले कागदजत्र, कागदाचा तुकडा किंवा एखादा जुना शोधनिबंध असू शकेल. संपादक वापरून सर्व मजकूर टाइप करणे हा बर्याच वापरकर्त्यांचा पर्याय असेल, परंतु ही प्रक्रिया वेळ घेणारी असू शकते. हे काम टाळण्यासाठी, आम्ही पर्याय निवडू शकतो मजकूर स्वयंचलितपणे काढण्यासाठी ओसीआर वापरा.
gImageReader आम्हाला बर्याच फंक्शन्स आणि टूल्स देईल. आयात केल्यानंतर हा अनुप्रयोग वापरण्यासाठी एक चांगले साधन आहे PDF किंवा स्कॅन केलेला दस्तऐवज आणि त्याची पुढील प्रक्रिया.
GImageReader सामान्य वैशिष्ट्ये
- आम्ही सक्षम होऊ डिस्क, स्कॅनिंग डिव्हाइस, क्लिपबोर्ड आणि स्क्रीनशॉट वरून पीडीएफ दस्तऐवज आणि प्रतिमा आयात करा. gImageReader अनेक प्रकारच्या फायली समर्थित करते. आपल्याला फक्त आमच्या फाईल्स टूलवर आणि आयात कराव्या लागतील एका क्लिकवर मजकूर काढा.
- आम्ही शक्यता आहे एचओसीआर कागदपत्रांमधून पीडीएफ दस्तऐवज व्युत्पन्न करा. gImageReader काढलेल्या मजकूराचे तीन स्वरूप, साध्या मजकूर, पीडीएफ आणि hOCR स्वरूपनास समर्थन देते.
- साधन आम्हाला शक्यता देते मॅन्युअल किंवा स्वयंचलित ओळख क्षेत्र परिभाषित करा काढण्यासाठी मजकूर निवडण्यासाठी.
- प्रतिमेवरील थेट प्रदर्शित केलेला मजकूर. आपण वरील स्क्रीनशॉटमध्ये पाहू शकता.
- साध्या मजकूरात काढल्यानंतर, gImageReader पोस्ट-प्रोसेसिंग क्रिया करतो, जसे की शब्दलेखन तपासणी. आम्ही निवडलेल्या भाषेनुसार (डीफॉल्ट ऑल इंग्लिश आहे), व्याकरणात्मक त्रुटी असलेले शब्द अधोरेखित करेल. याव्यतिरिक्त, जीमॅजॅरीडर आम्हाला काढलेल्या मजकूरासाठी वापरू इच्छित असलेले पृष्ठ सेगमेंटेशन मोड निवडण्याची परवानगी देतो.
- इतर ओसीआर टूल्सच्या विपरीत जिथे आम्ही एकाच वेळी एका फाईलसह कार्य करू शकतो, जिमॅजेरायडर त्यास समर्थन देतो असंख्य फायली आणि त्यांच्या बॅच प्रक्रिया आयातs.
या प्रोग्राम बद्दल आम्ही करू शकतो त्यांच्या अधिकृत पृष्ठावरील अधिक माहिती किंवा कोणतेही नवीन अद्यतन मिळवा GitHub.
उबंटू वर स्थापना
हे एक आहे क्रॉस प्लॅटफॉर्म अनुप्रयोग आणि हे दोन्ही Gnu / Linux आणि Windows वर कार्य करते. खालील ओळींमध्ये आम्ही उबंटू 18.04 मध्ये दर्शविल्याप्रमाणे जिमॅजेराएडर स्थापना प्रक्रिया दिसेल प्रोजेक्टचे गिटहब पृष्ठ.
पीपीए जोडा
हे सॉफ्टवेअर घेण्यासाठी आम्हाला आवश्यक आहे आमच्या सिस्टममध्ये पीपीए रेपॉजिटरी जोडा. टर्मिनल (Ctrl + Alt + T) उघडून पुढील कमांड टाइप करुन हे करू.
sudo add-apt-repository ppa:sandromani/gimagereader
GImageReader स्थापित करा
सॉफ्टवेअर अद्यतन उपलब्ध झाल्यानंतर, आम्ही आता करू शकतो अनुप्रयोग स्थापित करण्यासाठी पुढे जा समान टर्मिनलमध्ये टाइप करणे:
sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng
वरील सर्व गोष्टींबरोबरच, गिबाज रीडरने आपल्या उबंटूवर स्थापित केले पाहिजे. आता आपण आपल्या संगणकावर प्रोग्राम सुरू करण्यास सक्षम आहोत.
विस्थापित करा
जर आम्हाला हवे असेल gImageReader विस्थापित कराटर्मिनलमध्ये (Ctrl + Alt + T) आपल्याला फक्त पुढील आदेश वापरावे लागतील:
sudo apt-get remove gimagereader -y
प्रोग्राम काढून टाकण्यासाठी आम्ही कार्यान्वित करू शकतो:
sudo apt-get autoremove
आम्ही स्थापनेसाठी वापरत असलेला पीपीए समान टर्मिनलमध्ये टाइप करून आमच्या सिस्टममधून काढला जाऊ शकतो:
sudo add-apt-repository -r ppa:sandromani/gimagereader
gImageReader एक सोपा आहे फ्रंट-एंड Gtk / Qt for टेसेरेक्ट-ओसीआर हे प्रतिमांमधून मुद्रित मजकूर काढण्याची संपूर्ण प्रक्रिया सुलभ करते. हे आम्हाला फायली, स्कॅन केलेल्या प्रतिमा, पीडीएफ, पेस्ट केलेल्या क्लिपबोर्ड आयटम इत्यादीसह कार्य करण्यास अनुमती देईल. आमच्या प्रतिमांमधून मजकूर सहज आणि द्रुतपणे मिळविणे हे एक चांगला पर्याय बनवते.