அடுத்த கட்டுரையில் நாம் gImageReader ஐப் பார்க்கப் போகிறோம். இது ஒரு பயன்பாடு இயந்திரத்திற்கான முன் இறுதியில் டெஸிரராக்ட் OCR. டெசராக்டை அறியாதவர்களுக்கு, இது ஒரு ஆப்டிகல் கேரக்டர் ரெக்னிகேஷன் (ஓ.சி.ஆர்) இயந்திரம் என்று சொல்லுங்கள், இது செயற்கை நுண்ணறிவைப் பயன்படுத்தி படங்களில் அச்சிடப்பட்ட உரையைத் தேடவும் அங்கீகரிக்கவும் செய்கிறது. இது ஒரு திறந்த மூல நூலகம் மற்றும் சந்தையில் மிகவும் பிரபலமான OCR இயந்திரங்களில் ஒன்றாகும். படங்களிலிருந்து அச்சிடப்பட்ட உரையை பிரித்தெடுக்கும் முழு செயல்முறையையும் எளிதாக்குங்கள் கோப்புகள், ஸ்கேன் செய்யப்பட்ட படங்கள், PDF கள், ஒட்டப்பட்ட கிளிப்போர்டு உருப்படிகள் போன்றவற்றுடன் பயனர்களை வேலை செய்ய அனுமதிக்கிறது.
இன்று அனைத்து பயனர்களும், அலுவலகங்கள், வீடுகள் போன்றவற்றில் இருந்தாலும், ஒரு படத்திலிருந்து உரையை எடுக்க வேண்டிய சூழ்நிலையில் நம்மைக் காணலாம். இது பட வடிவமைப்பில் ஸ்கேன் செய்யப்பட்ட ஆவணம், ஒரு துண்டு காகிதம் அல்லது பழைய ஆய்வுக் கட்டுரையாக இருக்கலாம். பல பயனர்கள் எடுக்கும் விருப்பம் ஒரு உரையைப் பயன்படுத்தி எல்லா உரையையும் தட்டச்சு செய்வதாகும், ஆனால் இந்த செயல்முறை நேரத்தை எடுத்துக்கொள்ளும். இந்த வேலையைத் தவிர்க்க, நாங்கள் விருப்பத்தையும் தேர்வு செய்யலாம் உரையை தானாக பிரித்தெடுக்க OCR ஐப் பயன்படுத்தவும்.
gImageReader எங்களுக்கு பல செயல்பாடுகளையும் கருவிகளையும் வழங்கும். இந்த பயன்பாடு இறக்குமதி செய்த பிறகு பயன்படுத்த ஒரு நல்ல கருவியாகும் எம் அல்லது ஸ்கேன் செய்யப்பட்ட ஆவணம் மற்றும் அதன் மேலும் செயலாக்கம்.
GImageReader பொது அம்சங்கள்
- நம்மால் முடியும் வட்டு, ஸ்கேனிங் சாதனங்கள், கிளிப்போர்டு மற்றும் ஸ்கிரீன் ஷாட்களிலிருந்து PDF ஆவணங்கள் மற்றும் படங்களை இறக்குமதி செய்க. gImageReader பல வகையான கோப்புகளை ஆதரிக்கிறது. நாங்கள் எங்கள் கோப்புகளை கருவிக்கு இறக்குமதி செய்ய வேண்டும் ஒரே கிளிக்கில் உரையை பிரித்தெடுக்கவும்.
- அதற்கான சாத்தியம் நமக்கு இருக்கும் hOCR ஆவணங்களிலிருந்து PDF ஆவணங்களை உருவாக்குங்கள். பிரித்தெடுக்கப்பட்ட உரை, எளிய உரை, PDF மற்றும் hOCR வடிவத்தின் மூன்று வடிவங்களை gImageReader ஆதரிக்கிறது.
- கருவி நமக்கு சாத்தியத்தை வழங்கும் ஒரு கையேடு அல்லது தானியங்கி அங்கீகார பகுதியை வரையறுக்கவும் பிரித்தெடுக்க உரையைத் தேர்ந்தெடுக்க.
- அங்கீகரிக்கப்பட்ட உரை படத்திற்கு அடுத்ததாக நேரடியாக காட்டப்படும். மேலே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.
- எளிய உரைக்கு பிரித்தெடுத்த பிறகு, gImageReader பிந்தைய செயலாக்க செயல்களைச் செய்கிறது பிழைதிருத்தும். நாம் தேர்ந்தெடுக்கும் மொழியைப் பொறுத்து (இயல்புநிலை அனைத்து ஆங்கிலம்), இலக்கண பிழைகள் உள்ள சொற்களை அடிக்கோடிட்டுக் காட்டும். கூடுதலாக, பிரித்தெடுக்கப்பட்ட உரைக்கு நாம் பயன்படுத்த விரும்பும் பக்க பிரிவு பயன்முறையைத் தேர்ந்தெடுக்க gImageReader அனுமதிக்கிறது.
- ஒரு நேரத்தில் ஒரு கோப்போடு வேலை செய்யக்கூடிய பிற OCR கருவிகளைப் போலன்றி, gImageReader ஆதரிக்கிறது ஏராளமான கோப்புகளின் இறக்குமதி மற்றும் அவற்றின் தொகுதி செயலாக்கம்s.
இந்த திட்டத்தைப் பற்றி நம்மால் முடியும் அவர்களின் அதிகாரப்பூர்வ பக்கத்தில் கூடுதல் தகவல் அல்லது புதிய புதுப்பிப்பைப் பெறுங்கள் மகிழ்ச்சியா.
உபுண்டுவில் நிறுவல்
இது ஒரு குறுக்கு மேடை பயன்பாடு இது குனு / லினக்ஸ் மற்றும் விண்டோஸ் இரண்டிலும் வேலை செய்கிறது. பின்வரும் வரிகளில், உபுண்டு 18.04 இல் சுட்டிக்காட்டப்பட்டுள்ளபடி gImageReader நிறுவல் செயல்முறையைப் பார்ப்போம் திட்டத்தின் கிட்ஹப் பக்கம்.
பிபிஏ சேர்க்கவும்
இந்த மென்பொருளைப் பெற நமக்குத் தேவைப்படும் எங்கள் கணினியில் பிபிஏ களஞ்சியத்தைச் சேர்க்கவும். ஒரு முனையத்தை (Ctrl + Alt + T) திறந்து பின்வரும் கட்டளையைத் தட்டச்சு செய்வதன் மூலம் இதைச் செய்வோம்:
sudo add-apt-repository ppa:sandromani/gimagereader
GImageReader ஐ நிறுவவும்
மென்பொருள் புதுப்பிப்பு கிடைத்த பிறகு, இப்போது நாம் செய்யலாம் பயன்பாட்டை நிறுவ தொடரவும் ஒரே முனையத்தில் தட்டச்சு செய்க:
sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng
மேலே உள்ள அனைத்தையும் கொண்டு, gImageReader உங்கள் உபுண்டுவில் நிறுவப்பட வேண்டும். இப்போது நம் கணினியில் நிரலைத் தொடங்க முடியும்.
நீக்குதல்
நாம் விரும்பினால் gImageReader ஐ நிறுவல் நீக்கு, ஒரு முனையத்தில் (Ctrl + Alt + T) நாம் பின்வரும் கட்டளையை மட்டுமே பயன்படுத்த வேண்டும்:
sudo apt-get remove gimagereader -y
நிரலை நீக்குவதை முடிக்க, நாங்கள் இயக்கலாம்:
sudo apt-get autoremove
நிறுவலுக்கு நாங்கள் பயன்படுத்தும் பிபிஏ அதே முனையத்தில் தட்டச்சு செய்வதன் மூலம் எங்கள் கணினியிலிருந்து அகற்றப்படலாம்:
sudo add-apt-repository -r ppa:sandromani/gimagereader
gImageReader ஒரு எளிமையானது முன் இறுதியில் Gtk / Qt டெசராக்ட்- ocr படங்களிலிருந்து அச்சிடப்பட்ட உரையை பிரித்தெடுக்கும் முழு செயல்முறையையும் எளிதாக்குகிறது. கோப்புகள், ஸ்கேன் செய்யப்பட்ட படங்கள், PDF, ஒட்டப்பட்ட கிளிப்போர்டு உருப்படிகள் போன்றவற்றுடன் வேலை செய்ய இது நம்மை அனுமதிக்கும். எங்கள் படங்களிலிருந்து உரையை எளிதாகவும் விரைவாகவும் பெற இது ஒரு நல்ல வழி.