gImageReader, OCR திறன் கொண்ட PDF பயன்பாடு

gimagereader பற்றி

அடுத்த கட்டுரையில் நாம் gImageReader ஐப் பார்க்கப் போகிறோம். இது ஒரு பயன்பாடு இயந்திரத்திற்கான முன் இறுதியில் டெஸிரராக்ட் OCR. டெசராக்டை அறியாதவர்களுக்கு, இது ஒரு ஆப்டிகல் கேரக்டர் ரெக்னிகேஷன் (ஓ.சி.ஆர்) இயந்திரம் என்று சொல்லுங்கள், இது செயற்கை நுண்ணறிவைப் பயன்படுத்தி படங்களில் அச்சிடப்பட்ட உரையைத் தேடவும் அங்கீகரிக்கவும் செய்கிறது. இது ஒரு திறந்த மூல நூலகம் மற்றும் சந்தையில் மிகவும் பிரபலமான OCR இயந்திரங்களில் ஒன்றாகும். படங்களிலிருந்து அச்சிடப்பட்ட உரையை பிரித்தெடுக்கும் முழு செயல்முறையையும் எளிதாக்குங்கள் கோப்புகள், ஸ்கேன் செய்யப்பட்ட படங்கள், PDF கள், ஒட்டப்பட்ட கிளிப்போர்டு உருப்படிகள் போன்றவற்றுடன் பயனர்களை வேலை செய்ய அனுமதிக்கிறது.

இன்று அனைத்து பயனர்களும், அலுவலகங்கள், வீடுகள் போன்றவற்றில் இருந்தாலும், ஒரு படத்திலிருந்து உரையை எடுக்க வேண்டிய சூழ்நிலையில் நம்மைக் காணலாம். இது பட வடிவமைப்பில் ஸ்கேன் செய்யப்பட்ட ஆவணம், ஒரு துண்டு காகிதம் அல்லது பழைய ஆய்வுக் கட்டுரையாக இருக்கலாம். பல பயனர்கள் எடுக்கும் விருப்பம் ஒரு உரையைப் பயன்படுத்தி எல்லா உரையையும் தட்டச்சு செய்வதாகும், ஆனால் இந்த செயல்முறை நேரத்தை எடுத்துக்கொள்ளும். இந்த வேலையைத் தவிர்க்க, நாங்கள் விருப்பத்தையும் தேர்வு செய்யலாம் உரையை தானாக பிரித்தெடுக்க OCR ஐப் பயன்படுத்தவும்.

gImageReader எங்களுக்கு பல செயல்பாடுகளையும் கருவிகளையும் வழங்கும். இந்த பயன்பாடு இறக்குமதி செய்த பிறகு பயன்படுத்த ஒரு நல்ல கருவியாகும் எம் அல்லது ஸ்கேன் செய்யப்பட்ட ஆவணம் மற்றும் அதன் மேலும் செயலாக்கம்.

GImageReader பொது அம்சங்கள்

ocr gImageReader

  • நம்மால் முடியும் வட்டு, ஸ்கேனிங் சாதனங்கள், கிளிப்போர்டு மற்றும் ஸ்கிரீன் ஷாட்களிலிருந்து PDF ஆவணங்கள் மற்றும் படங்களை இறக்குமதி செய்க. gImageReader பல வகையான கோப்புகளை ஆதரிக்கிறது. நாங்கள் எங்கள் கோப்புகளை கருவிக்கு இறக்குமதி செய்ய வேண்டும் ஒரே கிளிக்கில் உரையை பிரித்தெடுக்கவும்.
  • அதற்கான சாத்தியம் நமக்கு இருக்கும் hOCR ஆவணங்களிலிருந்து PDF ஆவணங்களை உருவாக்குங்கள். பிரித்தெடுக்கப்பட்ட உரை, எளிய உரை, PDF மற்றும் hOCR வடிவத்தின் மூன்று வடிவங்களை gImageReader ஆதரிக்கிறது.
  • கருவி நமக்கு சாத்தியத்தை வழங்கும் ஒரு கையேடு அல்லது தானியங்கி அங்கீகார பகுதியை வரையறுக்கவும் பிரித்தெடுக்க உரையைத் தேர்ந்தெடுக்க.
  • அங்கீகரிக்கப்பட்ட உரை படத்திற்கு அடுத்ததாக நேரடியாக காட்டப்படும். மேலே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.
  • எளிய உரைக்கு பிரித்தெடுத்த பிறகு, gImageReader பிந்தைய செயலாக்க செயல்களைச் செய்கிறது பிழைதிருத்தும். நாம் தேர்ந்தெடுக்கும் மொழியைப் பொறுத்து (இயல்புநிலை அனைத்து ஆங்கிலம்), இலக்கண பிழைகள் உள்ள சொற்களை அடிக்கோடிட்டுக் காட்டும். கூடுதலாக, பிரித்தெடுக்கப்பட்ட உரைக்கு நாம் பயன்படுத்த விரும்பும் பக்க பிரிவு பயன்முறையைத் தேர்ந்தெடுக்க gImageReader அனுமதிக்கிறது.
  • ஒரு நேரத்தில் ஒரு கோப்போடு வேலை செய்யக்கூடிய பிற OCR கருவிகளைப் போலன்றி, gImageReader ஆதரிக்கிறது ஏராளமான கோப்புகளின் இறக்குமதி மற்றும் அவற்றின் தொகுதி செயலாக்கம்s.

இந்த திட்டத்தைப் பற்றி நம்மால் முடியும் அவர்களின் அதிகாரப்பூர்வ பக்கத்தில் கூடுதல் தகவல் அல்லது புதிய புதுப்பிப்பைப் பெறுங்கள் மகிழ்ச்சியா.

உபுண்டுவில் நிறுவல்

பயன்பாடு ஒரு பி.டி.எஃப் உடன் இயங்குகிறது

இது ஒரு குறுக்கு மேடை பயன்பாடு இது குனு / லினக்ஸ் மற்றும் விண்டோஸ் இரண்டிலும் வேலை செய்கிறது. பின்வரும் வரிகளில், உபுண்டு 18.04 இல் சுட்டிக்காட்டப்பட்டுள்ளபடி gImageReader நிறுவல் செயல்முறையைப் பார்ப்போம் திட்டத்தின் கிட்ஹப் பக்கம்.

பிபிஏ சேர்க்கவும்

இந்த மென்பொருளைப் பெற நமக்குத் தேவைப்படும் எங்கள் கணினியில் பிபிஏ களஞ்சியத்தைச் சேர்க்கவும். ஒரு முனையத்தை (Ctrl + Alt + T) திறந்து பின்வரும் கட்டளையைத் தட்டச்சு செய்வதன் மூலம் இதைச் செய்வோம்:

ரெப்போ gImageReader ஐச் சேர்க்கவும்

sudo add-apt-repository ppa:sandromani/gimagereader

GImageReader ஐ நிறுவவும்

மென்பொருள் புதுப்பிப்பு கிடைத்த பிறகு, இப்போது நாம் செய்யலாம் பயன்பாட்டை நிறுவ தொடரவும் ஒரே முனையத்தில் தட்டச்சு செய்க:

gImageReader நிறுவல்

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

மேலே உள்ள அனைத்தையும் கொண்டு, gImageReader உங்கள் உபுண்டுவில் நிறுவப்பட வேண்டும். இப்போது நம் கணினியில் நிரலைத் தொடங்க முடியும்.

பயன்பாட்டு துவக்கி

நீக்குதல்

நாம் விரும்பினால் gImageReader ஐ நிறுவல் நீக்கு, ஒரு முனையத்தில் (Ctrl + Alt + T) நாம் பின்வரும் கட்டளையை மட்டுமே பயன்படுத்த வேண்டும்:

gImageReader ஐ அகற்று

sudo apt-get remove gimagereader -y

நிரலை நீக்குவதை முடிக்க, நாங்கள் இயக்கலாம்:

sudo apt-get autoremove

நிறுவலுக்கு நாங்கள் பயன்படுத்தும் பிபிஏ அதே முனையத்தில் தட்டச்சு செய்வதன் மூலம் எங்கள் கணினியிலிருந்து அகற்றப்படலாம்:

கிமகிரீடர் பிபிஏ நிறுவல் நீக்கு

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader ஒரு எளிமையானது முன் இறுதியில் Gtk / Qt டெசராக்ட்- ocr படங்களிலிருந்து அச்சிடப்பட்ட உரையை பிரித்தெடுக்கும் முழு செயல்முறையையும் எளிதாக்குகிறது. கோப்புகள், ஸ்கேன் செய்யப்பட்ட படங்கள், PDF, ஒட்டப்பட்ட கிளிப்போர்டு உருப்படிகள் போன்றவற்றுடன் வேலை செய்ய இது நம்மை அனுமதிக்கும். எங்கள் படங்களிலிருந்து உரையை எளிதாகவும் விரைவாகவும் பெற இது ஒரு நல்ல வழி.


உங்கள் கருத்தை தெரிவிக்கவும்

உங்கள் மின்னஞ்சல் முகவரி வெளியிடப்பட்ட முடியாது. தேவையான புலங்கள் குறிக்கப்பட்டிருக்கும் *

*

*

  1. தரவுக்கு பொறுப்பு: மிகுவல் ஏஞ்சல் கேடன்
  2. தரவின் நோக்கம்: கட்டுப்பாட்டு ஸ்பேம், கருத்து மேலாண்மை.
  3. சட்டபூர்வமாக்கல்: உங்கள் ஒப்புதல்
  4. தரவின் தொடர்பு: சட்டபூர்வமான கடமையால் தவிர மூன்றாம் தரப்பினருக்கு தரவு தெரிவிக்கப்படாது.
  5. தரவு சேமிப்பு: ஆக்சென்டஸ் நெட்வொர்க்குகள் (EU) வழங்கிய தரவுத்தளம்
  6. உரிமைகள்: எந்த நேரத்திலும் உங்கள் தகவல்களை நீங்கள் கட்டுப்படுத்தலாம், மீட்டெடுக்கலாம் மற்றும் நீக்கலாம்.