હવે પછીના લેખમાં આપણે જીઆમેજરેડર પર એક નજર નાખીશું. આ એક એપ્લિકેશન છે એન્જિન માટે ફ્રન્ટ એન્ડ ટેસ્સેક્ટ ઓસીઆર. જેઓ પરીક્ષણને જાણતા નથી, એમ કહો કે તે optપ્ટિકલ કેરેક્ટર રેકગ્નિશન (OCR) એન્જિન છે જે છબીઓ પર છાપેલ લખાણ શોધવા અને ઓળખવા માટે કૃત્રિમ બુદ્ધિનો ઉપયોગ કરે છે. તે એક ખુલ્લું સ્રોત પુસ્તકાલય છે અને બજારમાં સૌથી પ્રખ્યાત ઓસીઆર એન્જિન છે. છબીઓથી છાપેલ ટેક્સ્ટ કાractવાની સંપૂર્ણ પ્રક્રિયાને સરળ બનાવો વપરાશકર્તાઓ ફાઇલો, સ્કેન કરેલી છબીઓ, પીડીએફ, પેસ્ટ ક્લિપબોર્ડ આઇટમ્સ, વગેરે સાથે કામ કરવા દે છે.
આજે બધા વપરાશકર્તાઓ, officesફિસ, ઘરો, વગેરેમાં હોવા છતાં, આપણે આપણી જાતને એવી પરિસ્થિતિમાં શોધી શકીએ છીએ કે જેમાં છબીમાંથી ટેક્સ્ટ કા extવાની જરૂર છે. તે ઇમેજ ફોર્મેટમાં સ્કેન કરેલો દસ્તાવેજ, કાગળનો ટુકડો અથવા જૂનો સંશોધન કાગળ હોઈ શકે છે. ઘણા વપરાશકર્તાઓ જે વિકલ્પ લેશે તે સંપાદકનો ઉપયોગ કરીને બધા ટેક્સ્ટ ટાઇપ કરવા માટે હશે, પરંતુ આ પ્રક્રિયા સમય માંગી શકે છે. આ કાર્યને ટાળવા માટે, અમે પણ વિકલ્પ પસંદ કરી શકીએ છીએ ટેક્સ્ટને આપમેળે કા toવા માટે OCR નો ઉપયોગ કરો.
gImageReader અમને ઘણા કાર્યો અને સાધનો પ્રદાન કરશે. આ એપ્લિકેશન એક આયાત કર્યા પછી વાપરવા માટે એક સારું સાધન છે પીડીએફ અથવા સ્કેન કરેલું દસ્તાવેજ અને તેની આગળની પ્રક્રિયા.
જીઆમેજરેડર સામાન્ય સુવિધાઓ
- અમે સક્ષમ થઈશું ડિસ્ક, સ્કેનીંગ ડિવાઇસેસ, ક્લિપબોર્ડ અને સ્ક્રીનશોટ પરથી પીડીએફ દસ્તાવેજો અને છબીઓ આયાત કરો. gImageReader ઘણી બધી ફાઇલોને સપોર્ટ કરે છે. આપણે ફક્ત અમારી ફાઇલોને ટૂલ પર અને આયાત કરવી પડશે એક ક્લિક સાથે ટેક્સ્ટ કાractો.
- અમે શક્યતા હશે HOCR દસ્તાવેજોમાંથી પીડીએફ દસ્તાવેજો બનાવો. જીઆમેજરેડર એક્સ્ટ્રેક્ટેડ ટેક્સ્ટ, સાદા ટેક્સ્ટ, પીડીએફ અને hOCR ફોર્મેટના ત્રણ ફોર્મેટ્સને સપોર્ટ કરે છે.
- સાધન આપણને શક્યતા આપશે મેન્યુઅલ અથવા સ્વચાલિત માન્યતા ક્ષેત્રને વ્યાખ્યાયિત કરો કાractવા માટે લખાણ પસંદ કરવા માટે.
- માન્ય ટેક્સ્ટ સીધી છબીની બાજુમાં પ્રદર્શિત થાય છે. તમે ઉપરના સ્ક્રીનશshotટમાં જોઈ શકો છો.
- સાદા ટેક્સ્ટને કાract્યા પછી, જીમેજરેડર પોસ્ટ-પ્રોસેસિંગ ક્રિયાઓ કરે છે, જેમ કે જોડણી ચકાસો. અમે જે ભાષા પસંદ કરીએ છીએ તેના આધારે (મૂળભૂત ઓલ અંગ્રેજી છે), વ્યાકરણની ભૂલો ધરાવતા શબ્દોને રેખાંકિત કરશે. આ ઉપરાંત, જીમેજરેડર અમને પેજ સેગમેન્ટેશન મોડને પસંદ કરવાની મંજૂરી આપે છે જે આપણે કા theેલા ટેક્સ્ટ માટે વાપરવા માંગીએ છીએ.
- અન્ય ઓસીઆર ટૂલ્સથી વિપરીત જ્યાં આપણે એક જ સમયે એક ફાઇલ સાથે કામ કરી શકીએ છીએ, જીજેમરેડર એ સપોર્ટ કરે છે અસંખ્ય ફાઇલો અને તેમની બેચ પ્રક્રિયાની આયાતs.
આ પ્રોગ્રામ વિશે આપણે કરી શકીએ છીએ તેમના સત્તાવાર પૃષ્ઠ પર વધુ માહિતી અથવા કોઈપણ નવા અપડેટ મેળવો GitHub.
ઉબુન્ટુ પર સ્થાપન
આ એક છે ક્રોસ પ્લેટફોર્મ એપ્લિકેશન અને તે Gnu / Linux અને Windows બંને પર કાર્ય કરે છે. નીચે આપેલ લીટીઓમાં આપણે ઉબન્ટુ 18.04 માં gImageReader ઇન્સ્ટોલેશન પ્રક્રિયા જોશું તેમ સૂચવ્યું છે પ્રોજેક્ટનું ગિટહબ પૃષ્ઠ.
પીપીએ ઉમેરો
આ સ softwareફ્ટવેર રાખવા માટે અમને જરૂર પડશે અમારી સિસ્ટમમાં પીપીએ રીપોઝીટરી ઉમેરો. આપણે આ ટર્મિનલ (Ctrl + Alt + T) ખોલીને અને નીચેનો આદેશ લખીને કરીશું:
sudo add-apt-repository ppa:sandromani/gimagereader
GImageReader સ્થાપિત કરો
સ theફ્ટવેર અપડેટ ઉપલબ્ધ થયા પછી, અમે હવે કરી શકીએ છીએ એપ્લિકેશન ઇન્સ્ટોલ કરવા આગળ વધો સમાન ટર્મિનલમાં ટાઇપ કરો:
sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng
ઉપરોક્ત તમામ સાથે, જીમેજરેડેરે તમારા ઉબુન્ટુ પર ઇન્સ્ટોલ કરવું જોઈએ. હવે આપણે આપણા કમ્પ્યુટર પર પ્રોગ્રામ શરૂ કરવામાં સમર્થ હોવા જોઈએ.
અનઇન્સ્ટોલ કરો
જો આપણે ઇચ્છીએ છીએ જીઆમેજરેડરને અનઇન્સ્ટોલ કરો, ટર્મિનલમાં (Ctrl + Alt + T) આપણે ફક્ત નીચેનો આદેશ જ વાપરવાનો રહેશે:
sudo apt-get remove gimagereader -y
પ્રોગ્રામને સમાપ્ત કરવા માટે, અમે ચલાવી શકીએ છીએ:
sudo apt-get autoremove
આપણે જે ઇન્સ્ટોલ કરવા માટે ઉપયોગ કરીએ છીએ તે PPA એ જ ટર્મિનલમાં લખીને આપણા સિસ્ટમમાંથી દૂર કરી શકાય છે:
sudo add-apt-repository -r ppa:sandromani/gimagereader
gImageReader એક સરળ છે ફ્રન્ટ-એન્ડ Gtk / Qt for પરીક્ષણ-ઓ.સી.આર. જે છબીઓથી છાપેલ ટેક્સ્ટ કાractવાની સંપૂર્ણ પ્રક્રિયાને સરળ બનાવે છે. તે અમને ફાઇલો, સ્કેન કરેલી છબીઓ, પીડીએફ, પેસ્ટ ક્લિપબોર્ડ આઇટમ્સ, વગેરે સાથે કામ કરવાની મંજૂરી આપશે. સરળતાથી અને ઝડપથી આપણી છબીઓમાંથી ટેક્સ્ટને બહાર કા toવા માટે આ એક સારો વિકલ્પ બનાવે છે.