gImageReader แอปพลิเคชัน PDF ที่มีความสามารถ OCR

ในบทความหน้าเราจะมาดู gImageReader นี่คือแอป ส่วนหน้าสำหรับเครื่องยนต์ Tesseract OCR. สำหรับผู้ที่ไม่รู้จัก Tesseract ให้บอกว่ามันเป็นเอ็นจิ้นการรู้จำอักขระด้วยแสง (OCR) ที่ใช้ปัญญาประดิษฐ์เพื่อค้นหาและจดจำข้อความที่พิมพ์บนรูปภาพ เป็นไลบรารีโอเพ่นซอร์สและหนึ่งในเอ็นจิ้น OCR ที่ได้รับความนิยมมากที่สุดในตลาด ลดความซับซ้อนของกระบวนการทั้งหมดในการแยกข้อความที่พิมพ์ออกจากรูปภาพ อนุญาตให้ผู้ใช้ทำงานกับไฟล์ภาพสแกน PDF รายการคลิปบอร์ดที่วาง ฯลฯ

ทุกวันนี้ผู้ใช้ทุกคนไม่ว่าจะอยู่ในสำนักงานบ้าน ฯลฯ เราพบว่าตัวเองอยู่ในสถานการณ์ที่ต้องดึงข้อความออกจากรูปภาพ อาจเป็นเอกสารที่สแกนในรูปแบบภาพกระดาษแผ่นหนึ่งหรืองานวิจัยเก่า ๆ ตัวเลือกที่ผู้ใช้จำนวนมากจะใช้คือพิมพ์ข้อความทั้งหมดโดยใช้โปรแกรมแก้ไข แต่กระบวนการนี้อาจใช้เวลานาน เพื่อหลีกเลี่ยงงานนี้เราสามารถเลือกตัวเลือกของ ใช้ OCR เพื่อแยกข้อความโดยอัตโนมัติ.

gImageReader จะนำเสนอฟังก์ชันและเครื่องมือมากมายให้เรา แอปพลิเคชั่นนี้เป็นเครื่องมือที่ดีที่จะใช้หลังจากนำเข้าไฟล์ รูปแบบไฟล์ PDF หรือเอกสารที่สแกนและการประมวลผลเพิ่มเติม

คุณสมบัติทั่วไปของ GImageReader

เราจะสามารถ นำเข้าเอกสาร PDF และรูปภาพจากดิสก์อุปกรณ์สแกนคลิปบอร์ดและภาพหน้าจอ. gImageReader รองรับไฟล์หลายประเภท เราจะต้องนำเข้าไฟล์ของเราไปยังเครื่องมือและ แยกข้อความได้ด้วยคลิกเดียว.
เราจะมีความเป็นไปได้ของ สร้างเอกสาร PDF จากเอกสาร hOCR. gImageReader รองรับรูปแบบข้อความที่แยกออกมาสามรูปแบบข้อความธรรมดา PDF และรูปแบบ hOCR
เครื่องมือนี้จะช่วยให้เรามีความเป็นไปได้ กำหนดพื้นที่การจดจำด้วยตนเองหรืออัตโนมัติ เพื่อเลือกข้อความที่จะแยก
ข้อความที่รู้จักจะแสดงอยู่ถัดจากรูปภาพ. ดังที่คุณเห็นในภาพหน้าจอด้านบน
หลังจากแยกเป็นข้อความธรรมดา gImageReader จะดำเนินการหลังการประมวลผลเช่น ตรวจสอบการสะกด. ขึ้นอยู่กับภาษาที่เราเลือก (ค่าเริ่มต้นคือภาษาอังกฤษทั้งหมด) จะขีดเส้นใต้คำที่มีข้อผิดพลาดทางไวยากรณ์ นอกจากนี้ gImageReader ยังช่วยให้เราสามารถเลือกโหมดการแบ่งส่วนหน้าที่เราต้องการใช้สำหรับข้อความที่แยกออกมา
แตกต่างจากเครื่องมือ OCR อื่น ๆ ที่เราสามารถทำงานกับไฟล์ทีละไฟล์ gImageReader รองรับไฟล์ นำเข้าไฟล์จำนวนมากและการประมวลผลแบทช์s.

เกี่ยวกับโปรแกรมนี้เราทำได้ รับข้อมูลเพิ่มเติมหรืออัปเดตใหม่ ๆ บนหน้าทางการของพวกเขา GitHub.

การติดตั้งบน Ubuntu

นี่คือ แอปพลิเคชันข้ามแพลตฟอร์ม และทำงานได้ทั้งบน Gnu / Linux และ Windows ในบรรทัดต่อไปนี้เราจะเห็นกระบวนการติดตั้ง gImageReader ใน Ubuntu 18.04 ตามที่ระบุใน หน้า GitHub ของโครงการ.

เพิ่ม PPA

ในการมีซอฟต์แวร์นี้เราจะต้องมี เพิ่มที่เก็บ PPA ในระบบของเรา. เราจะทำได้โดยเปิดเทอร์มินัล (Ctrl + Alt + T) แล้วพิมพ์คำสั่งต่อไปนี้:

sudo add-apt-repository ppa:sandromani/gimagereader

ติดตั้ง gImageReader

หลังจากการอัปเดตซอฟต์แวร์พร้อมใช้งานเราสามารถทำได้แล้ว ดำเนินการติดตั้งแอปพลิเคชัน พิมพ์ในเทอร์มินัลเดียวกัน:

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

จากทั้งหมดข้างต้น gImageReader ควรติดตั้งบน Ubuntu ของคุณ ตอนนี้เราควรจะเริ่มโปรแกรมบนคอมพิวเตอร์ของเราได้แล้ว

ถอนการติดตั้ง

ในกรณีที่เราต้องการ ถอนการติดตั้ง gImageReaderในเทอร์มินัล (Ctrl + Alt + T) เราจะต้องใช้คำสั่งต่อไปนี้เท่านั้น:

sudo apt-get remove gimagereader -y

ในการกำจัดโปรแกรมให้เสร็จสิ้นเรายังสามารถดำเนินการ:

sudo apt-get autoremove

PPA ที่เราใช้สำหรับการติดตั้งสามารถกำจัดออกจากระบบของเราได้โดยพิมพ์ในเทอร์มินัลเดียวกัน:

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader เป็นไฟล์ front-end Gtk / Qt สำหรับ tesseract-ocr ที่ช่วยลดความซับซ้อนของกระบวนการทั้งหมดในการแยกข้อความที่พิมพ์ออกจากรูปภาพ มันจะช่วยให้เราสามารถทำงานกับไฟล์ภาพสแกน PDF รายการคลิปบอร์ดที่วาง ฯลฯ สิ่งนี้ทำให้เป็นตัวเลือกที่ดีในการดึงข้อความออกจากรูปภาพของเราได้อย่างง่ายดายและรวดเร็ว

แสดงความคิดเห็นของคุณ ยกเลิกการตอบ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

คิดเห็น *

ชื่อ*

จดหมายอิเล็กทรอนิกส์*

ฉันยอมรับ ข้อกำหนดความเป็นส่วนตัว*

ผู้รับผิดชอบข้อมูล: Miguel ÁngelGatón
วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา

ฉันต้องการรับจดหมายข่าว

Ubunlog

gImageReader แอปพลิเคชั่น PDF ที่รองรับ OCR