gImageReader, एक OCR- सक्षम PDF एप्लिकेशन

जिम्मीडर के बारे में

अगले लेख में हम gImageReader पर एक नज़र डालने जा रहे हैं। यह एक ऐप है इंजन के लिए फ्रंट एंड टेसेरैक्ट ओसीआर। उन लोगों के लिए जो टेसरैक्ट को नहीं जानते हैं, कहते हैं कि यह एक ऑप्टिकल कैरेक्टर रिकॉग्निशन (ओसीआर) इंजन है जो छवियों पर मुद्रित पाठ को खोजने और पहचानने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करता है। यह एक ओपन सोर्स लाइब्रेरी है और बाजार में सबसे लोकप्रिय ओसीआर इंजनों में से एक है। छवियों से मुद्रित पाठ निकालने की पूरी प्रक्रिया को सरल बनाएं उपयोगकर्ताओं को फाइलों, स्कैन की गई छवियों, पीडीएफ, चिपके क्लिपबोर्ड आइटम आदि के साथ काम करने की अनुमति देता है।

आज सभी उपयोगकर्ता, चाहे वह कार्यालयों, घरों आदि में हों, हम खुद को एक ऐसी स्थिति में पा सकते हैं जिसमें हमें एक छवि से पाठ निकालने की आवश्यकता होती है। यह छवि प्रारूप, कागज का एक टुकड़ा, या एक पुराने शोध पत्र में स्कैन किया गया दस्तावेज़ हो सकता है। विकल्प जो कई उपयोगकर्ता लेते हैं, वह संपादक का उपयोग करके सभी पाठ टाइप करने के लिए होगा, लेकिन यह प्रक्रिया समय लेने वाली हो सकती है। इस काम से बचने के लिए, हम इसका विकल्प भी चुन सकते हैं पाठ को स्वचालित रूप से निकालने के लिए OCR का उपयोग करें.

gImageReader हमें कई कार्य और उपकरण प्रदान करेगा। यह एप्लिकेशन आयात करने के बाद उपयोग करने के लिए एक अच्छा उपकरण है पीडीएफ या स्कैन किए गए दस्तावेज़ और इसकी आगे की प्रक्रिया।

GImageReader सामान्य सुविधाएँ

ओसीआर जीइमेज रीडर

  • हम कर सकेंगे डिस्क, स्कैनिंग डिवाइस, क्लिपबोर्ड और स्क्रीनशॉट से पीडीएफ दस्तावेज़ और छवियां आयात करें। gImageReader कई प्रकार की फ़ाइलों का समर्थन करता है। हमें बस अपनी फ़ाइलों को टूल में आयात करना होगा और एक क्लिक से टेक्स्ट निकालें.
  • हमारी संभावना होगी एचओसीआर दस्तावेजों से पीडीएफ दस्तावेज़ उत्पन्न करें। gImageReader तीन निकाले गए पाठ स्वरूपों, सादे पाठ, PDF और hOCR प्रारूप का समर्थन करता है।
  • उपकरण हमें इसकी संभावना देगा एक मैनुअल या स्वचालित मान्यता क्षेत्र को परिभाषित करें निकालने के लिए पाठ का चयन करें।
  • मान्यता प्राप्त पाठ छवि के बगल में सीधे प्रदर्शित होता है। जैसा कि आप ऊपर दिए गए स्क्रीनशॉट में देख सकते हैं।
  • सादा पाठ निकालने के बाद, gImageReader पोस्ट-प्रोसेसिंग क्रिया करता है, जैसे कि अक्षर जाँच लें। हमारे द्वारा चुनी गई भाषा के आधार पर (डिफ़ॉल्ट सभी अंग्रेजी है), व्याकरणिक त्रुटियों वाले शब्दों को रेखांकित करेगा। इसके अलावा, gImageReader हमें पृष्ठ विभाजन मोड का चयन करने की अनुमति देता है जिसे हम निकाले गए पाठ के लिए उपयोग करना चाहते हैं।
  • अन्य ओसीआर टूल्स के विपरीत जहां हम एक समय में एक फ़ाइल के साथ काम कर सकते हैं, gImageReader समर्थन करता है कई फ़ाइलों और उनके बैच प्रसंस्करण का आयातs.

इस कार्यक्रम के बारे में हम कर सकते हैं अधिक जानकारी या उनके आधिकारिक पेज पर कोई नया अपडेट प्राप्त करें GitHub.

उबंटू पर इंस्टालेशन

एक पीडीएफ के साथ आवेदन चल रहा है

यह एक है गुणक अनुप्रयोग और यह Gnu / Linux और Windows दोनों पर काम करता है। निम्न पंक्तियों में हम Ubuntu 18.04 में gImageReader स्थापना प्रक्रिया देखेंगे जैसा कि संकेत दिया गया है परियोजना का GitHub पृष्ठ.

पीपीए जोड़ें

इस सॉफ्टवेयर के लिए हमें आवश्यकता होगी PPA रिपॉजिटरी को हमारे सिस्टम में जोड़ें। हम एक टर्मिनल (Ctrl + Alt + T) खोलकर और निम्न कमांड टाइप करके ऐसा करेंगे:

रेपो gImageReader जोड़ें

sudo add-apt-repository ppa:sandromani/gimagereader

GImageReader स्थापित करें

सॉफ़्टवेयर अपडेट उपलब्ध होने के बाद, अब हम कर सकते हैं एप्लिकेशन इंस्टॉल करने के लिए आगे बढ़ें एक ही टर्मिनल में टाइपिंग:

gImageReader स्थापना

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

उपरोक्त सभी के साथ, gImageReader को आपके Ubuntu पर स्थापित करना चाहिए। अब हमें अपने कंप्यूटर पर प्रोग्राम शुरू करने में सक्षम होना चाहिए।

ऐप लॉन्चर

स्थापना रद्द करें

मामले में हम चाहते हैं gImageReader की स्थापना रद्द करें, एक टर्मिनल में (Ctrl + Alt + T) हमें केवल निम्नलिखित कमांड का उपयोग करना होगा:

gImageReader निकालें

sudo apt-get remove gimagereader -y

कार्यक्रम को समाप्त करने के लिए, हम भी निष्पादित कर सकते हैं:

sudo apt-get autoremove

पीपीए जो हम इंस्टॉलेशन के लिए उपयोग करते हैं, उसी टर्मिनल में टाइप करके हमारे सिस्टम से समाप्त किया जा सकता है:

Gimagereader पीपीए की स्थापना रद्द करें

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader एक सरल है फ्रंट-एंड Gtk / Qt के लिए Tesseract-ओसीआर जो छवियों से मुद्रित पाठ निकालने की पूरी प्रक्रिया को सरल बनाता है। यह हमें फाइलों, स्कैन की गई छवियों, पीडीएफ, चिपके क्लिपबोर्ड आइटम आदि के साथ काम करने की अनुमति देगा। यह पाठ को हमारी छवियों से आसानी से और जल्दी से बाहर निकालने के लिए एक अच्छा विकल्प बनाता है।


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: मिगुएल elngel Gatón
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।