gImageReader ، تطبيق PDF قادر على التعرف الضوئي على الحروف

حول gimagereader

في المقالة التالية سوف نلقي نظرة على gImageReader. هذا تطبيق الواجهة الأمامية للمحرك Tesseract OCR. بالنسبة لأولئك الذين لا يعرفون Tesseract ، قل إنه محرك التعرف الضوئي على الأحرف (OCR) الذي يستخدم الذكاء الاصطناعي للبحث والتعرف على النص المطبوع على الصور. إنها مكتبة مفتوحة المصدر وواحدة من أشهر محركات OCR في السوق. تبسيط العملية الكاملة لاستخراج النص المطبوع من الصور السماح للمستخدمين بالعمل مع الملفات والصور الممسوحة ضوئيًا وملفات PDF وعناصر الحافظة الملصقة وما إلى ذلك.

اليوم جميع المستخدمين ، سواء في المكاتب أو المنازل أو ما إلى ذلك ، يمكننا أن نجد أنفسنا في موقف نحتاج فيه إلى استخراج نص من صورة. يمكن أن يكون مستندًا ممسوحًا ضوئيًا بتنسيق صورة أو قطعة من الورق أو ورقة بحث قديمة. سيكون الخيار الذي قد يتخذه العديد من المستخدمين هو كتابة كل النص باستخدام محرر ، ولكن هذه العملية قد تستغرق وقتًا طويلاً. لتجنب هذا العمل ، يمكننا أيضًا اختيار خيار استخدم OCR لاستخراج النص تلقائيًا.

سيقدم لنا برنامج gImageReader العديد من الوظائف والأدوات. هذا التطبيق هو أداة جيدة للاستخدام بعد استيراد ملف PDF أو المستند الممسوح ضوئيًا ومعالجته الإضافية.

GImageReader العام الميزات

ocr gImageReader

  • سنكون قادرين استيراد مستندات وصور PDF من القرص وأجهزة المسح والحافظة ولقطات الشاشة. يدعم gImageReader أنواعًا عديدة من الملفات. سيتعين علينا ببساطة استيراد ملفاتنا إلى الأداة و استخراج النص بنقرة واحدة.
  • سيكون لدينا إمكانية إنشاء مستندات PDF من مستندات hOCR. يدعم gImageReader ثلاثة تنسيقات للنص المستخرج ، والنص العادي ، و PDF ، وتنسيق hOCR.
  • ستمنحنا الأداة إمكانية تحديد منطقة التعرف اليدوي أو التلقائي لتحديد النص المراد استخراجه.
  • يتم عرض النص الذي تم التعرف عليه مباشرة بجوار الصورة. كما ترى في الصورة أعلاه.
  • بعد الاستخراج إلى نص عادي ، يقوم gImageReader بتنفيذ إجراءات ما بعد المعالجة ، مثل التدقيق الإملائي. اعتمادًا على اللغة التي نختارها (الافتراضي هو All English) ، لتسطير الكلمات التي بها أخطاء نحوية. بالإضافة إلى ذلك ، يتيح لنا gImageReader تحديد وضع تجزئة الصفحة الذي نريد استخدامه للنص المستخرج.
  • على عكس أدوات OCR الأخرى حيث يمكننا العمل مع ملف واحد في كل مرة ، يدعم gImageReader تنسيق استيراد العديد من الملفات ومعالجة الدُفعاتs.

حول هذا البرنامج نستطيع الحصول على مزيد من المعلومات أو أي تحديث جديد على صفحتهم الرسمية GitHub جيثب:.

التثبيت على أوبونتو

تطبيق يعمل مع ملف pdf

هذا هو تطبيق متعدد المنصات وهو يعمل على كل من Gnu / Linux و Windows. في الأسطر التالية ، سنرى عملية تثبيت gImageReader في Ubuntu 18.04 كما هو موضح في صفحة جيثب الخاصة بالمشروع.

أضف PPA

للحصول على هذا البرنامج سنحتاجه إضافة مستودع PPA إلى نظامنا. سنفعل ذلك عن طريق فتح محطة طرفية (Ctrl + Alt + T) وكتابة الأمر التالي:

إضافة ريبو gImageReader

sudo add-apt-repository ppa:sandromani/gimagereader

قم بتثبيت gImageReader

بعد توفر تحديث البرنامج ، يمكننا الآن تابع تثبيت التطبيق الكتابة في نفس الجهاز:

تثبيت gImageReader

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

مع كل ما سبق ، يجب تثبيت gImageReader على نظام Ubuntu الخاص بك. الآن يجب أن نكون قادرين على بدء البرنامج على جهاز الكمبيوتر الخاص بنا.

قاذفة التطبيق

إلغاء

في حال أردنا قم بإلغاء تثبيت gImageReader، في المحطة الطرفية (Ctrl + Alt + T) سيتعين علينا فقط استخدام الأمر التالي:

إزالة gImageReader

sudo apt-get remove gimagereader -y

لإنهاء حذف البرنامج ، يمكننا أيضًا تنفيذ ما يلي:

sudo apt-get autoremove

يمكن التخلص من PPA الذي نستخدمه للتثبيت من نظامنا عن طريق كتابة نفس الجهاز:

إلغاء تثبيت gimagereader PPA

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader هو ملف بسيط الواجهة الأمامية Gtk / Qt لـ تسراكت- ocr الذي يأتي بتبسيط عملية استخراج النص المطبوع من الصور بالكامل. سيسمح لنا بالعمل مع الملفات والصور الممسوحة ضوئيًا وملفات PDF وعناصر الحافظة الملصقة وما إلى ذلك. هذا يجعله خيارًا جيدًا لإخراج النص من صورنا بسهولة وبسرعة.


اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

*

*

  1. المسؤول عن البيانات: ميغيل أنخيل جاتون
  2. الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
  3. الشرعية: موافقتك
  4. توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
  5. تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
  6. الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.