gImageReader แอปพลิเคชั่น PDF ที่รองรับ OCR

เกี่ยวกับ gimagereader

ในบทความหน้าเราจะมาดู gImageReader นี่คือแอป ส่วนหน้าสำหรับเครื่องยนต์ Tesseract OCR. สำหรับผู้ที่ไม่รู้จัก Tesseract ให้บอกว่ามันเป็นเอ็นจิ้นการรู้จำอักขระด้วยแสง (OCR) ที่ใช้ปัญญาประดิษฐ์เพื่อค้นหาและจดจำข้อความที่พิมพ์บนรูปภาพ เป็นไลบรารีโอเพ่นซอร์สและหนึ่งในเอ็นจิ้น OCR ที่ได้รับความนิยมมากที่สุดในตลาด ลดความซับซ้อนของกระบวนการทั้งหมดในการแยกข้อความที่พิมพ์ออกจากรูปภาพ อนุญาตให้ผู้ใช้ทำงานกับไฟล์ภาพสแกน PDF รายการคลิปบอร์ดที่วาง ฯลฯ

ทุกวันนี้ผู้ใช้ทุกคนไม่ว่าจะอยู่ในสำนักงานบ้าน ฯลฯ เราพบว่าตัวเองอยู่ในสถานการณ์ที่ต้องดึงข้อความออกจากรูปภาพ อาจเป็นเอกสารที่สแกนในรูปแบบภาพกระดาษแผ่นหนึ่งหรืองานวิจัยเก่า ๆ ตัวเลือกที่ผู้ใช้จำนวนมากจะใช้คือพิมพ์ข้อความทั้งหมดโดยใช้โปรแกรมแก้ไข แต่กระบวนการนี้อาจใช้เวลานาน เพื่อหลีกเลี่ยงงานนี้เราสามารถเลือกตัวเลือกของ ใช้ OCR เพื่อแยกข้อความโดยอัตโนมัติ.

gImageReader จะนำเสนอฟังก์ชันและเครื่องมือมากมายให้เรา แอปพลิเคชั่นนี้เป็นเครื่องมือที่ดีที่จะใช้หลังจากนำเข้าไฟล์ รูปแบบไฟล์ PDF หรือเอกสารที่สแกนและการประมวลผลเพิ่มเติม

คุณสมบัติทั่วไปของ GImageReader

ocr gImageReader

  • เราจะสามารถ นำเข้าเอกสาร PDF และรูปภาพจากดิสก์อุปกรณ์สแกนคลิปบอร์ดและภาพหน้าจอ. gImageReader รองรับไฟล์หลายประเภท เราจะต้องนำเข้าไฟล์ของเราไปยังเครื่องมือและ แยกข้อความได้ด้วยคลิกเดียว.
  • เราจะมีความเป็นไปได้ของ สร้างเอกสาร PDF จากเอกสาร hOCR. gImageReader รองรับรูปแบบข้อความที่แยกออกมาสามรูปแบบข้อความธรรมดา PDF และรูปแบบ hOCR
  • เครื่องมือนี้จะช่วยให้เรามีความเป็นไปได้ กำหนดพื้นที่การจดจำด้วยตนเองหรืออัตโนมัติ เพื่อเลือกข้อความที่จะแยก
  • ข้อความที่รู้จักจะแสดงอยู่ถัดจากรูปภาพ. ดังที่คุณเห็นในภาพหน้าจอด้านบน
  • หลังจากแยกเป็นข้อความธรรมดา gImageReader จะดำเนินการหลังการประมวลผลเช่น ตรวจสอบการสะกด. ขึ้นอยู่กับภาษาที่เราเลือก (ค่าเริ่มต้นคือภาษาอังกฤษทั้งหมด) จะขีดเส้นใต้คำที่มีข้อผิดพลาดทางไวยากรณ์ นอกจากนี้ gImageReader ยังช่วยให้เราสามารถเลือกโหมดการแบ่งส่วนหน้าที่เราต้องการใช้สำหรับข้อความที่แยกออกมา
  • แตกต่างจากเครื่องมือ OCR อื่น ๆ ที่เราสามารถทำงานกับไฟล์ทีละไฟล์ gImageReader รองรับไฟล์ นำเข้าไฟล์จำนวนมากและการประมวลผลแบทช์s.

เกี่ยวกับโปรแกรมนี้เราทำได้ รับข้อมูลเพิ่มเติมหรืออัปเดตใหม่ ๆ บนหน้าทางการของพวกเขา GitHub.

การติดตั้งบน Ubuntu

แอปพลิเคชันที่ทำงานด้วย pdf

นี่คือ แอปพลิเคชันข้ามแพลตฟอร์ม และทำงานได้ทั้งบน Gnu / Linux และ Windows ในบรรทัดต่อไปนี้เราจะเห็นกระบวนการติดตั้ง gImageReader ใน Ubuntu 18.04 ตามที่ระบุใน หน้า GitHub ของโครงการ.

เพิ่ม PPA

ในการมีซอฟต์แวร์นี้เราจะต้องมี เพิ่มที่เก็บ PPA ในระบบของเรา. เราจะทำได้โดยเปิดเทอร์มินัล (Ctrl + Alt + T) แล้วพิมพ์คำสั่งต่อไปนี้:

เพิ่ม repo gImageReader

sudo add-apt-repository ppa:sandromani/gimagereader

ติดตั้ง gImageReader

หลังจากการอัปเดตซอฟต์แวร์พร้อมใช้งานเราสามารถทำได้แล้ว ดำเนินการติดตั้งแอปพลิเคชัน พิมพ์ในเทอร์มินัลเดียวกัน:

การติดตั้ง gImageReader

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

จากทั้งหมดข้างต้น gImageReader ควรติดตั้งบน Ubuntu ของคุณ ตอนนี้เราควรจะเริ่มโปรแกรมบนคอมพิวเตอร์ของเราได้แล้ว

ตัวเรียกใช้แอป

ถอนการติดตั้ง

ในกรณีที่เราต้องการ ถอนการติดตั้ง gImageReaderในเทอร์มินัล (Ctrl + Alt + T) เราจะต้องใช้คำสั่งต่อไปนี้เท่านั้น:

ลบ gImageReader

sudo apt-get remove gimagereader -y

ในการกำจัดโปรแกรมให้เสร็จสิ้นเรายังสามารถดำเนินการ:

sudo apt-get autoremove

PPA ที่เราใช้สำหรับการติดตั้งสามารถกำจัดออกจากระบบของเราได้โดยพิมพ์ในเทอร์มินัลเดียวกัน:

ถอนการติดตั้ง gimagereader PPA

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader เป็นไฟล์ front-end Gtk / Qt สำหรับ tesseract-ocr ที่ช่วยลดความซับซ้อนของกระบวนการทั้งหมดในการแยกข้อความที่พิมพ์ออกจากรูปภาพ มันจะช่วยให้เราสามารถทำงานกับไฟล์ภาพสแกน PDF รายการคลิปบอร์ดที่วาง ฯลฯ สิ่งนี้ทำให้เป็นตัวเลือกที่ดีในการดึงข้อความออกจากรูปภาพของเราได้อย่างง่ายดายและรวดเร็ว


แสดงความคิดเห็นของคุณ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

*

*

  1. ผู้รับผิดชอบข้อมูล: Miguel ÁngelGatón
  2. วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
  3. ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
  4. การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
  5. การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
  6. สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา