জিআইজেগ্রিডার, একটি ওসিআর-সক্ষম পিডিএফ অ্যাপ্লিকেশন

gimagereader সম্পর্কে

পরের নিবন্ধে আমরা জিমাজেডার রিডারটি একবার দেখে নিই। এটি একটি অ্যাপ্লিকেশন ইঞ্জিনের জন্য সম্মুখ প্রান্ত Tesseract ওসিআর। যারা টেসারেক্ট জানেন না তাদের জন্য বলুন যে এটি একটি অপটিক্যাল ক্যারেক্টার রিকগনিশন (ওসিআর) ইঞ্জিন যা চিত্রগুলিতে মুদ্রিত পাঠ্য অনুসন্ধান এবং সনাক্ত করতে কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে। এটি একটি ওপেন সোর্স লাইব্রেরি এবং বাজারে অন্যতম জনপ্রিয় ওসিআর ইঞ্জিন। চিত্রগুলি থেকে মুদ্রিত পাঠ্য উত্তোলনের পুরো প্রক্রিয়াটিকে সহজ করুন ব্যবহারকারীদের ফাইল, স্ক্যান করা চিত্র, পিডিএফ, আটকানো ক্লিপবোর্ড আইটেম ইত্যাদির সাথে কাজ করার অনুমতি দেয়

আজ সমস্ত ব্যবহারকারী, অফিস, বাড়ি ইত্যাদিতেই হোক না কেন, আমরা নিজেকে এমন একটি পরিস্থিতিতে আবিষ্কার করতে পারি যেখানে আমাদের একটি চিত্র থেকে পাঠ্য উত্তোলন করতে হবে। এটি চিত্রের বিন্যাসে একটি স্ক্যান করা নথি, কোনও কাগজের টুকরো বা কোনও পুরানো গবেষণা কাগজ হতে পারে। অনেক ব্যবহারকারী যে বিকল্পটি গ্রহণ করবেন তা হ'ল সম্পাদক ব্যবহার করে সমস্ত পাঠ্য টাইপ করা হবে তবে এই প্রক্রিয়াটি সময় সাপেক্ষ হতে পারে। এই কাজটি এড়াতে, আমরা বিকল্পের বিকল্পটিও বেছে নিতে পারি পাঠ্যটি স্বয়ংক্রিয়ভাবে বের করতে একটি ওসিআর ব্যবহার করুন.

জিগ্যামারইডার আমাদের অনেকগুলি ক্রিয়াকলাপ এবং সরঞ্জাম সরবরাহ করবে। এই অ্যাপ্লিকেশনটি একটি আমদানির পরে ব্যবহার করার জন্য একটি ভাল সরঞ্জাম পিডিএফ বা স্ক্যান করা নথি এবং এর আরও প্রক্রিয়াজাতকরণ।

জিগ্যামারইডার সাধারণ বৈশিষ্ট্য

ocr gImageReader

  • আমরা করতে পারব ডিস্ক, স্ক্যানিং ডিভাইস, ক্লিপবোর্ড এবং স্ক্রিনশট থেকে পিডিএফ ডকুমেন্টস এবং চিত্রগুলি আমদানি করুন। gImageReader অনেক ধরণের ফাইল সমর্থন করে। আমাদের কেবল আমাদের ফাইলগুলি সরঞ্জামে এবং আমদানি করতে হবে এক ক্লিকে পাঠ্য উত্তোলন করুন.
  • আমাদের সম্ভাবনা থাকবে এইচওসিআর ডকুমেন্ট থেকে পিডিএফ ডকুমেন্ট তৈরি করুন। জিগ্যামারিডার এক্সট্রাক্ট করা টেক্সট, প্লেইন টেক্সট, পিডিএফ এবং hOCR ফর্ম্যাটের তিনটি ফর্ম্যাট সমর্থন করে supports
  • সরঞ্জাম আমাদের সম্ভাবনা দেবে একটি ম্যানুয়াল বা স্বয়ংক্রিয় স্বীকৃতি অঞ্চল নির্ধারণ করুন নিষ্কাশন করতে পাঠ্য নির্বাচন করুন।
  • স্বীকৃত পাঠ্যটি সরাসরি চিত্রের পাশে প্রদর্শিত হয়। আপনি উপরের স্ক্রিনশট এ দেখতে পারেন।
  • সাধারণ পাঠ্য থেকে উত্তোলনের পরে, জিগ্যামারইডার পোস্ট-প্রসেসিং ক্রিয়াগুলি সম্পাদন করে, যেমন বানান যাচাই। আমরা যে ভাষাটি চয়ন করি তার উপর নির্ভর করে (ডিফল্ট হ'ল ইংলিশ), ব্যাকরণগত ত্রুটিযুক্ত শব্দগুলিকে আন্ডারলাইন করবে। তদ্ব্যতীত, জিগ্যামারইডার আমাদের নিষ্ক্রিয় পাঠ্যের জন্য যে পৃষ্ঠা সেগমেন্টেশন মোডটি ব্যবহার করতে চাই তা নির্বাচন করতে সহায়তা করে।
  • অন্যান্য ওসিআর সরঞ্জামগুলির মতো নয় যেখানে আমরা একবারে একটি ফাইল নিয়ে কাজ করতে পারি, জিগ্যামারইডার সমর্থন করে অসংখ্য ফাইল এবং তাদের ব্যাচ প্রক্রিয়াজাতকরণ আমদানিs.

এই প্রোগ্রামটি সম্পর্কে আমরা পারি তাদের অফিসিয়াল পৃষ্ঠায় আরও তথ্য বা কোনও নতুন আপডেট পান GitHub.

উবুন্টুতে ইনস্টলেশন

পিডিএফ দিয়ে চলমান অ্যাপ্লিকেশন

এটি একটি ক্রস প্ল্যাটফর্ম অ্যাপ্লিকেশন এবং এটি Gnu / লিনাক্স এবং উইন্ডোজ উভয় ক্ষেত্রেই কাজ করে। নিম্নলিখিত লাইনগুলিতে আমরা উবুন্টু 18.04-তে জিগ্যাসিরিডার ইনস্টলেশন প্রক্রিয়াটি দেখতে পেয়েছি in প্রকল্পের গিটহাব পৃষ্ঠা.

পিপিএ যুক্ত করুন

এই সফ্টওয়্যারটি থাকতে আমাদের দরকার হবে আমাদের সিস্টেমে পিপিএ সংগ্রহস্থল যুক্ত করুন। আমরা এটি একটি টার্মিনাল (Ctrl + Alt + T) খোলার মাধ্যমে এবং নিম্নলিখিত আদেশটি টাইপ করে করব:

রেপো gImageReader যোগ করুন

sudo add-apt-repository ppa:sandromani/gimagereader

GImageReader ইনস্টল করুন

সফ্টওয়্যার আপডেট উপলব্ধ করার পরে, আমরা এখন করতে পারেন অ্যাপ্লিকেশন ইনস্টল করার জন্য এগিয়ে যান একই টার্মিনালে টাইপ করা:

gImageReader ইনস্টলেশন

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

উপরের সমস্তটির সাথে, জিগ্যামারইডারটি আপনার উবুন্টুতে ইনস্টল করা উচিত। এখন আমাদের কম্পিউটারে প্রোগ্রামটি চালু করতে সক্ষম হওয়া উচিত।

অ্যাপ্লিকেশন লঞ্চার

আনইনস্টল

ক্ষেত্রে আমরা চাই জিমাজেড রিডার আনইনস্টল করুন, একটি টার্মিনালে (Ctrl + Alt + T) কেবলমাত্র নিম্নলিখিত কমান্ডটি ব্যবহার করতে হবে:

জিগ্যামারিডার সরান

sudo apt-get remove gimagereader -y

প্রোগ্রামটি মুছে ফেলা শেষ করতে, আমরা এক্সিকিউটও করতে পারি:

sudo apt-get autoremove

আমরা ইনস্টলেশনটির জন্য যে পিপিএ ব্যবহার করি তা একই টার্মিনালে টাইপ করে আমাদের সিস্টেম থেকে নির্মূল করা যেতে পারে:

জিমাগ্রেডার পিপিএ আনইনস্টল করুন

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader একটি সাধারণ ফ্রন্ট-এন্ড Gtk / Qt for tesseract-ocr এটি চিত্র থেকে মুদ্রিত পাঠ্য উত্তোলনের পুরো প্রক্রিয়াটিকে সহজতর করে। এটি আমাদের ফাইল, স্ক্যান করা চিত্র, পিডিএফ, আটকানো ক্লিপবোর্ড আইটেম ইত্যাদির সাথে কাজ করার অনুমতি দেবে সহজেই এবং দ্রুত আমাদের চিত্রগুলি থেকে টেক্সটটি বের করা এটি একটি ভাল বিকল্প হিসাবে তৈরি করে।


আপনার মন্তব্য দিন

আপনার ইমেল ঠিকানা প্রকাশিত হবে না। প্রয়োজনীয় ক্ষেত্রগুলি দিয়ে চিহ্নিত করা *

*

*

  1. ডেটার জন্য দায়বদ্ধ: মিগুয়েল অ্যাঞ্জেল গাটান
  2. ডেটার উদ্দেশ্য: নিয়ন্ত্রণ স্প্যাম, মন্তব্য পরিচালনা।
  3. আইনীকরণ: আপনার সম্মতি
  4. তথ্য যোগাযোগ: ডেটা আইনি বাধ্যবাধকতা ব্যতীত তৃতীয় পক্ষের কাছে জানানো হবে না।
  5. ডেটা স্টোরেজ: ওসেন্টাস নেটওয়ার্কস (ইইউ) দ্বারা হোস্ট করা ডেটাবেস
  6. অধিকার: যে কোনও সময় আপনি আপনার তথ্য সীমাবদ্ধ করতে, পুনরুদ্ধার করতে এবং মুছতে পারেন।