ในบทความถัดไปเราจะมาดู TextSnatcher หากคุณเป็นหนึ่งในผู้ใช้ที่มักจะทำงานด้วย OCRคุณอาจต้องการเห็นแอปง่าย ๆ ที่สร้างขึ้นจากแอปที่ซับซ้อนที่ยอดเยี่ยมเช่นนี้ Tesseract. หากคุณกำลังมองหา วิธีที่ง่ายและไม่ซับซ้อนในการคัดลอกข้อความจากรูปภาพใน Gnu/Linuxคุณสามารถดู TextSnatcher ได้ เนื่องจากอาจเหมาะกับสิ่งที่คุณกำลังมองหา
ความเป็นไปได้ของ แยกข้อความจากรูปภาพ ไฟล์ PDF หรือสิ่งที่คล้ายกัน, ไม่มีอะไรใหม่ วันนี้เราสามารถหาเครื่องมือต่างๆ มากมายเพื่อทำงานนี้ แต่ในขณะนี้ไม่มีใครทำได้อย่างง่ายดายเหมือนที่ TextSnatcher ทำได้
เครื่องมือนี้ทำการจดจำอักขระด้วยแสง (OCR) ในไม่กี่วินาที ซึ่งจะทำให้ผู้ใช้ คัดลอกข้อความอย่างรวดเร็วจากสิ่งที่มองเห็นบนหน้าจอไปยังคลิปบอร์ดของระบบ ทำให้พร้อมที่จะวางที่อื่น. การรู้จำอักขระ มักรู้จักกันในชื่อ OCR (จากการรู้จำอักขระด้วยแสงภาษาอังกฤษ) เป็นกระบวนการที่มุ่งเป้าไปที่การแปลงข้อความดิจิทัล ซึ่งจะระบุโดยอัตโนมัติจากรูปภาพ สัญลักษณ์ หรืออักขระที่เป็นของตัวอักษรบางตัว แล้วจัดเก็บไว้เป็นข้อมูล เพื่อให้เราสามารถโต้ตอบกับสิ่งเหล่านี้ผ่านโปรแกรมแก้ไขข้อความ
สำหรับอินเทอร์เฟซของแอพนี้ มันไม่ง่ายเลยที่จะใช้ เราจะต้องเริ่มต้นเท่านั้น คลิกที่ปุ่ม 'Snatch Now!' หลังจาก เราจะเห็นเครื่องมือจับภาพหน้าจอเริ่มต้นปรากฏขึ้นเพื่อจับภาพเต็มหน้าจอ, จับภาพหน้าต่างปัจจุบันหรือเลือกพื้นที่ที่จะจับภาพ (แนะนำ) เน้นเฉพาะข้อความที่เราต้องการคัดลอก
คุณสมบัติทั่วไปของ TextSnatcher
- โปรแกรมนี้จะช่วยให้เรา คัดลอกข้อความของรูปภาพอย่างง่ายดาย เราดำเนินการ OCR ได้ในไม่กี่วินาทีกับผลลัพธ์ที่ค่อนข้างดี
- บัญชีด้วย รองรับหลายภาษา. สามารถเลือกได้จากปุ่มทางด้านซ้ายที่ด้านบนของหน้าต่าง
- จะช่วยให้เรา คัดลอกข้อความของภาพเพื่อทำการเลือกพื้นที่.
- มันเป็น โปรแกรมที่ใช้งานง่ายและรวดเร็ว.
- สามารถ ดูวิดีโอบางส่วนของโปรแกรมนี้ทำงาน ในมัน ที่เก็บ GitHub.
- แอปนี้ ใช้ Tesseract OCR 4.x สำหรับการจดจำอักขระ. หากคุณสนใจที่จะทราบข้อมูลเพิ่มเติม คุณสามารถอ่านเกี่ยวกับ Tesseract y โครงการสตาร์ Tesseract.
ติดตั้ง TextSnatcher บน Ubuntu
โปรแกรมนี้ เราสามารถหาได้ในแพ็คเกจ Flatpak ที่ Flathub. หากคุณใช้ Ubuntu 20.04 และยังไม่ได้เปิดใช้งานเทคโนโลยีนี้ในระบบของคุณ คุณสามารถดำเนินการต่อ คู่มือ ที่เพื่อนร่วมงานเขียนไว้ในบล็อกนี้เมื่อสักครู่
ไปยัง ติดตั้งโปรแกรมนี้บน Ubuntuเราจะต้องเปิดเทอร์มินัลเท่านั้น (Ctrl + Alt + T) และรันคำสั่งในนั้น:
flatpak install flathub com.github.rajsolai.textsnatcher
เมื่อการติดตั้งโปรแกรมเสร็จสิ้น เราจะต้องค้นหาตัวเรียกใช้บนคอมพิวเตอร์ของเราเท่านั้น หรือเรียกใช้ในเทอร์มินัลเพื่อ เริ่มโปรแกรม:
flatpak run com.github.rajsolai.textsnatcher
หากหลังจากเริ่มซอฟต์แวร์นี้แล้ว ทำงานไม่ถูกต้องหรือไม่เริ่มทำงานเลย คุณอาจต้องติดตั้ง gnome-สกรีนช็อต. หากเป็นกรณีนี้ สิ่งที่คุณต้องทำคือพิมพ์เทอร์มินัล (Ctrl+Alt+T):
sudo apt install gnome-screenshot
ถอนการติดตั้ง
ในกรณีที่คุณต้องการ ลบโปรแกรมออกจากระบบของคุณจำเป็นต้องเปิดเทอร์มินัลเท่านั้น (Ctrl+Alt+T) และเรียกใช้คำสั่งในนั้น:
flatpak uninstall com.github.rajsolai.textsnatcher
เครื่องมือนี้ออกแบบมาสำหรับระบบปฏิบัติการที่แตกต่างกัน แม้ว่าจะเขียนบทความนี้ แต่ฉันทดสอบบน Ubuntu 20.04/21.10 เท่านั้น โดยมีผลดีในทั้งสองกรณี มอเตอร์ Tesseract OCR ให้พลังแก่เครื่องมือนี้ และใช้งานได้ดีเมื่อพื้นที่ที่เลือกมีความละเอียดสูง หรือข้อความที่จะคัดลอกมีขนาดใหญ่และชัดเจน.
ในความละเอียดต่ำหรือบล็อก 'ข้อความ' ที่เล็กมาก บางครั้งอักขระบางตัวจะถูกคัดลอกไปยังขนาดใหญ่ขึ้น. นอกจากนี้ หากการเลือกมีการตกแต่งจำนวนมาก อาจนำไปสู่ผลลัพธ์ที่เข้าใจยาก เนื่องจากเครื่องมือพยายามกำหนดอักขระข้อความให้กับส่วนต่างๆ ของเส้นขอบ รูปภาพ ฯลฯ