gImageReader, OCR திறன்களைக் கொண்ட ஒரு PDF பயன்பாடு

அடுத்த கட்டுரையில் நாம் gImageReader ஐப் பார்க்கப் போகிறோம். இது ஒரு பயன்பாடு இயந்திரத்திற்கான முன் இறுதியில் டெஸிரராக்ட் OCR. டெசராக்டை அறியாதவர்களுக்கு, இது ஒரு ஆப்டிகல் கேரக்டர் ரெக்னிகேஷன் (ஓ.சி.ஆர்) இயந்திரம் என்று சொல்லுங்கள், இது செயற்கை நுண்ணறிவைப் பயன்படுத்தி படங்களில் அச்சிடப்பட்ட உரையைத் தேடவும் அங்கீகரிக்கவும் செய்கிறது. இது ஒரு திறந்த மூல நூலகம் மற்றும் சந்தையில் மிகவும் பிரபலமான OCR இயந்திரங்களில் ஒன்றாகும். படங்களிலிருந்து அச்சிடப்பட்ட உரையை பிரித்தெடுக்கும் முழு செயல்முறையையும் எளிதாக்குங்கள் கோப்புகள், ஸ்கேன் செய்யப்பட்ட படங்கள், PDF கள், ஒட்டப்பட்ட கிளிப்போர்டு உருப்படிகள் போன்றவற்றுடன் பயனர்களை வேலை செய்ய அனுமதிக்கிறது.

இன்று அனைத்து பயனர்களும், அலுவலகங்கள், வீடுகள் போன்றவற்றில் இருந்தாலும், ஒரு படத்திலிருந்து உரையை எடுக்க வேண்டிய சூழ்நிலையில் நம்மைக் காணலாம். இது பட வடிவமைப்பில் ஸ்கேன் செய்யப்பட்ட ஆவணம், ஒரு துண்டு காகிதம் அல்லது பழைய ஆய்வுக் கட்டுரையாக இருக்கலாம். பல பயனர்கள் எடுக்கும் விருப்பம் ஒரு உரையைப் பயன்படுத்தி எல்லா உரையையும் தட்டச்சு செய்வதாகும், ஆனால் இந்த செயல்முறை நேரத்தை எடுத்துக்கொள்ளும். இந்த வேலையைத் தவிர்க்க, நாங்கள் விருப்பத்தையும் தேர்வு செய்யலாம் உரையை தானாக பிரித்தெடுக்க OCR ஐப் பயன்படுத்தவும்.

gImageReader எங்களுக்கு பல செயல்பாடுகளையும் கருவிகளையும் வழங்கும். இந்த பயன்பாடு இறக்குமதி செய்த பிறகு பயன்படுத்த ஒரு நல்ல கருவியாகும் எம் அல்லது ஸ்கேன் செய்யப்பட்ட ஆவணம் மற்றும் அதன் மேலும் செயலாக்கம்.

GImageReader பொது அம்சங்கள்

நம்மால் முடியும் வட்டு, ஸ்கேனிங் சாதனங்கள், கிளிப்போர்டு மற்றும் ஸ்கிரீன் ஷாட்களிலிருந்து PDF ஆவணங்கள் மற்றும் படங்களை இறக்குமதி செய்க. gImageReader பல வகையான கோப்புகளை ஆதரிக்கிறது. நாங்கள் எங்கள் கோப்புகளை கருவிக்கு இறக்குமதி செய்ய வேண்டும் ஒரே கிளிக்கில் உரையை பிரித்தெடுக்கவும்.
அதற்கான சாத்தியம் நமக்கு இருக்கும் hOCR ஆவணங்களிலிருந்து PDF ஆவணங்களை உருவாக்குங்கள். பிரித்தெடுக்கப்பட்ட உரை, எளிய உரை, PDF மற்றும் hOCR வடிவத்தின் மூன்று வடிவங்களை gImageReader ஆதரிக்கிறது.
கருவி நமக்கு சாத்தியத்தை வழங்கும் ஒரு கையேடு அல்லது தானியங்கி அங்கீகார பகுதியை வரையறுக்கவும் பிரித்தெடுக்க உரையைத் தேர்ந்தெடுக்க.
அங்கீகரிக்கப்பட்ட உரை படத்திற்கு அடுத்ததாக நேரடியாக காட்டப்படும். மேலே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.
எளிய உரைக்கு பிரித்தெடுத்த பிறகு, gImageReader பிந்தைய செயலாக்க செயல்களைச் செய்கிறது பிழைதிருத்தும். நாம் தேர்ந்தெடுக்கும் மொழியைப் பொறுத்து (இயல்புநிலை அனைத்து ஆங்கிலம்), இலக்கண பிழைகள் உள்ள சொற்களை அடிக்கோடிட்டுக் காட்டும். கூடுதலாக, பிரித்தெடுக்கப்பட்ட உரைக்கு நாம் பயன்படுத்த விரும்பும் பக்க பிரிவு பயன்முறையைத் தேர்ந்தெடுக்க gImageReader அனுமதிக்கிறது.
ஒரு நேரத்தில் ஒரு கோப்போடு வேலை செய்யக்கூடிய பிற OCR கருவிகளைப் போலன்றி, gImageReader ஆதரிக்கிறது ஏராளமான கோப்புகளின் இறக்குமதி மற்றும் அவற்றின் தொகுதி செயலாக்கம்s.

இந்த திட்டத்தைப் பற்றி நம்மால் முடியும் அவர்களின் அதிகாரப்பூர்வ பக்கத்தில் கூடுதல் தகவல் அல்லது புதிய புதுப்பிப்பைப் பெறுங்கள் மகிழ்ச்சியா.

உபுண்டுவில் நிறுவல்

இது ஒரு குறுக்கு மேடை பயன்பாடு இது குனு / லினக்ஸ் மற்றும் விண்டோஸ் இரண்டிலும் வேலை செய்கிறது. பின்வரும் வரிகளில், உபுண்டு 18.04 இல் சுட்டிக்காட்டப்பட்டுள்ளபடி gImageReader நிறுவல் செயல்முறையைப் பார்ப்போம் திட்டத்தின் கிட்ஹப் பக்கம்.

பிபிஏ சேர்க்கவும்

இந்த மென்பொருளைப் பெற நமக்குத் தேவைப்படும் எங்கள் கணினியில் பிபிஏ களஞ்சியத்தைச் சேர்க்கவும். ஒரு முனையத்தை (Ctrl + Alt + T) திறந்து பின்வரும் கட்டளையைத் தட்டச்சு செய்வதன் மூலம் இதைச் செய்வோம்:

sudo add-apt-repository ppa:sandromani/gimagereader

GImageReader ஐ நிறுவவும்

மென்பொருள் புதுப்பிப்பு கிடைத்த பிறகு, இப்போது நாம் செய்யலாம் பயன்பாட்டை நிறுவ தொடரவும் ஒரே முனையத்தில் தட்டச்சு செய்க:

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

மேலே உள்ள அனைத்தையும் கொண்டு, gImageReader உங்கள் உபுண்டுவில் நிறுவப்பட வேண்டும். இப்போது நம் கணினியில் நிரலைத் தொடங்க முடியும்.

நீக்குதல்

நாம் விரும்பினால் gImageReader ஐ நிறுவல் நீக்கு, ஒரு முனையத்தில் (Ctrl + Alt + T) நாம் பின்வரும் கட்டளையை மட்டுமே பயன்படுத்த வேண்டும்:

sudo apt-get remove gimagereader -y

நிரலை நீக்குவதை முடிக்க, நாங்கள் இயக்கலாம்:

sudo apt-get autoremove

நிறுவலுக்கு நாங்கள் பயன்படுத்தும் பிபிஏ அதே முனையத்தில் தட்டச்சு செய்வதன் மூலம் எங்கள் கணினியிலிருந்து அகற்றப்படலாம்:

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader ஒரு எளிமையானது முன் இறுதியில் Gtk / Qt டெசராக்ட்- ocr படங்களிலிருந்து அச்சிடப்பட்ட உரையை பிரித்தெடுக்கும் முழு செயல்முறையையும் எளிதாக்குகிறது. கோப்புகள், ஸ்கேன் செய்யப்பட்ட படங்கள், PDF, ஒட்டப்பட்ட கிளிப்போர்டு உருப்படிகள் போன்றவற்றுடன் வேலை செய்ய இது நம்மை அனுமதிக்கும். எங்கள் படங்களிலிருந்து உரையை எளிதாகவும் விரைவாகவும் பெற இது ஒரு நல்ல வழி.

உங்கள் கருத்தை தெரிவிக்கவும்

உங்கள் மின்னஞ்சல் முகவரி வெளியிடப்பட்ட முடியாது. தேவையான புலங்கள் குறிக்கப்பட்டிருக்கும் *

கருத்து *

பெயர்*

மின்னணு அஞ்சல்*

நான் ஏற்றுக்கொள்கிறேன் தனியுரிமை விதிமுறைகள்*

தரவுக்கு பொறுப்பு: மிகுவல் ஏஞ்சல் கேடன்
தரவின் நோக்கம்: கட்டுப்பாட்டு ஸ்பேம், கருத்து மேலாண்மை.
சட்டபூர்வமாக்கல்: உங்கள் ஒப்புதல்
தரவின் தொடர்பு: சட்டபூர்வமான கடமையால் தவிர மூன்றாம் தரப்பினருக்கு தரவு தெரிவிக்கப்படாது.
தரவு சேமிப்பு: ஆக்சென்டஸ் நெட்வொர்க்குகள் (EU) வழங்கிய தரவுத்தளம்
உரிமைகள்: எந்த நேரத்திலும் உங்கள் தகவல்களை நீங்கள் கட்டுப்படுத்தலாம், மீட்டெடுக்கலாம் மற்றும் நீக்கலாம்.

செய்திமடலைப் பெற விரும்புகிறேன்

Ubunlog

gImageReader, OCR திறன் கொண்ட PDF பயன்பாடு

GImageReader பொது அம்சங்கள்

உபுண்டுவில் நிறுவல்

பிபிஏ சேர்க்கவும்

GImageReader ஐ நிறுவவும்

நீக்குதல்

உங்கள் கருத்தை தெரிவிக்கவும்

GImageReader பொது அம்சங்கள்

உபுண்டுவில் நிறுவல்

பிபிஏ சேர்க்கவும்

GImageReader ஐ நிறுவவும்

நீக்குதல்

உங்கள் கருத்தை தெரிவிக்கவும் பதிலை ரத்துசெய்

உங்கள் கருத்தை தெரிவிக்கவும்