ในบทความหน้าเราจะมาดู gImageReader นี่คือแอป ส่วนหน้าสำหรับเครื่องยนต์ Tesseract OCR. สำหรับผู้ที่ไม่รู้จัก Tesseract ให้บอกว่ามันเป็นเอ็นจิ้นการรู้จำอักขระด้วยแสง (OCR) ที่ใช้ปัญญาประดิษฐ์เพื่อค้นหาและจดจำข้อความที่พิมพ์บนรูปภาพ เป็นไลบรารีโอเพ่นซอร์สและหนึ่งในเอ็นจิ้น OCR ที่ได้รับความนิยมมากที่สุดในตลาด ลดความซับซ้อนของกระบวนการทั้งหมดในการแยกข้อความที่พิมพ์ออกจากรูปภาพ อนุญาตให้ผู้ใช้ทำงานกับไฟล์ภาพสแกน PDF รายการคลิปบอร์ดที่วาง ฯลฯ
ทุกวันนี้ผู้ใช้ทุกคนไม่ว่าจะอยู่ในสำนักงานบ้าน ฯลฯ เราพบว่าตัวเองอยู่ในสถานการณ์ที่ต้องดึงข้อความออกจากรูปภาพ อาจเป็นเอกสารที่สแกนในรูปแบบภาพกระดาษแผ่นหนึ่งหรืองานวิจัยเก่า ๆ ตัวเลือกที่ผู้ใช้จำนวนมากจะใช้คือพิมพ์ข้อความทั้งหมดโดยใช้โปรแกรมแก้ไข แต่กระบวนการนี้อาจใช้เวลานาน เพื่อหลีกเลี่ยงงานนี้เราสามารถเลือกตัวเลือกของ ใช้ OCR เพื่อแยกข้อความโดยอัตโนมัติ.
gImageReader จะนำเสนอฟังก์ชันและเครื่องมือมากมายให้เรา แอปพลิเคชั่นนี้เป็นเครื่องมือที่ดีที่จะใช้หลังจากนำเข้าไฟล์ รูปแบบไฟล์ PDF หรือเอกสารที่สแกนและการประมวลผลเพิ่มเติม
คุณสมบัติทั่วไปของ GImageReader
- เราจะสามารถ นำเข้าเอกสาร PDF และรูปภาพจากดิสก์อุปกรณ์สแกนคลิปบอร์ดและภาพหน้าจอ. gImageReader รองรับไฟล์หลายประเภท เราจะต้องนำเข้าไฟล์ของเราไปยังเครื่องมือและ แยกข้อความได้ด้วยคลิกเดียว.
- เราจะมีความเป็นไปได้ของ สร้างเอกสาร PDF จากเอกสาร hOCR. gImageReader รองรับรูปแบบข้อความที่แยกออกมาสามรูปแบบข้อความธรรมดา PDF และรูปแบบ hOCR
- เครื่องมือนี้จะช่วยให้เรามีความเป็นไปได้ กำหนดพื้นที่การจดจำด้วยตนเองหรืออัตโนมัติ เพื่อเลือกข้อความที่จะแยก
- ข้อความที่รู้จักจะแสดงอยู่ถัดจากรูปภาพ. ดังที่คุณเห็นในภาพหน้าจอด้านบน
- หลังจากแยกเป็นข้อความธรรมดา gImageReader จะดำเนินการหลังการประมวลผลเช่น ตรวจสอบการสะกด. ขึ้นอยู่กับภาษาที่เราเลือก (ค่าเริ่มต้นคือภาษาอังกฤษทั้งหมด) จะขีดเส้นใต้คำที่มีข้อผิดพลาดทางไวยากรณ์ นอกจากนี้ gImageReader ยังช่วยให้เราสามารถเลือกโหมดการแบ่งส่วนหน้าที่เราต้องการใช้สำหรับข้อความที่แยกออกมา
- แตกต่างจากเครื่องมือ OCR อื่น ๆ ที่เราสามารถทำงานกับไฟล์ทีละไฟล์ gImageReader รองรับไฟล์ นำเข้าไฟล์จำนวนมากและการประมวลผลแบทช์s.
เกี่ยวกับโปรแกรมนี้เราทำได้ รับข้อมูลเพิ่มเติมหรืออัปเดตใหม่ ๆ บนหน้าทางการของพวกเขา GitHub.
การติดตั้งบน Ubuntu
นี่คือ แอปพลิเคชันข้ามแพลตฟอร์ม และทำงานได้ทั้งบน Gnu / Linux และ Windows ในบรรทัดต่อไปนี้เราจะเห็นกระบวนการติดตั้ง gImageReader ใน Ubuntu 18.04 ตามที่ระบุใน หน้า GitHub ของโครงการ.
เพิ่ม PPA
ในการมีซอฟต์แวร์นี้เราจะต้องมี เพิ่มที่เก็บ PPA ในระบบของเรา. เราจะทำได้โดยเปิดเทอร์มินัล (Ctrl + Alt + T) แล้วพิมพ์คำสั่งต่อไปนี้:
sudo add-apt-repository ppa:sandromani/gimagereader
ติดตั้ง gImageReader
หลังจากการอัปเดตซอฟต์แวร์พร้อมใช้งานเราสามารถทำได้แล้ว ดำเนินการติดตั้งแอปพลิเคชัน พิมพ์ในเทอร์มินัลเดียวกัน:
sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng
จากทั้งหมดข้างต้น gImageReader ควรติดตั้งบน Ubuntu ของคุณ ตอนนี้เราควรจะเริ่มโปรแกรมบนคอมพิวเตอร์ของเราได้แล้ว
ถอนการติดตั้ง
ในกรณีที่เราต้องการ ถอนการติดตั้ง gImageReaderในเทอร์มินัล (Ctrl + Alt + T) เราจะต้องใช้คำสั่งต่อไปนี้เท่านั้น:
sudo apt-get remove gimagereader -y
ในการกำจัดโปรแกรมให้เสร็จสิ้นเรายังสามารถดำเนินการ:
sudo apt-get autoremove
PPA ที่เราใช้สำหรับการติดตั้งสามารถกำจัดออกจากระบบของเราได้โดยพิมพ์ในเทอร์มินัลเดียวกัน:
sudo add-apt-repository -r ppa:sandromani/gimagereader
gImageReader เป็นไฟล์ front-end Gtk / Qt สำหรับ tesseract-ocr ที่ช่วยลดความซับซ้อนของกระบวนการทั้งหมดในการแยกข้อความที่พิมพ์ออกจากรูปภาพ มันจะช่วยให้เราสามารถทำงานกับไฟล์ภาพสแกน PDF รายการคลิปบอร์ดที่วาง ฯลฯ สิ่งนี้ทำให้เป็นตัวเลือกที่ดีในการดึงข้อความออกจากรูปภาพของเราได้อย่างง่ายดายและรวดเร็ว