Dalam artikel seterusnya kita akan melihat TextSnatcher. Jika anda adalah salah seorang pengguna yang biasanya bekerja dengannya OCR, anda mungkin ingin melihat apl ringkas yang dibina di atas apl kompleks yang hebat seperti ini Tesseract. jika anda sedang mencari cara yang mudah dan tidak rumit untuk menyalin teks daripada imej dalam Gnu/Linux, anda boleh lihat TextSnatcher, ia mungkin sesuai dengan apa yang anda cari.
Kemungkinan ekstrak teks daripada imej, fail PDF atau perkara yang serupa, bukanlah sesuatu yang baru. Hari ini kita boleh menemui banyak alat yang berbeza untuk melakukan kerja ini, tetapi pada masa ini tiada yang melakukannya semudah TextSnatcher boleh.
Alat ini melakukan pengecaman aksara optik (OCR) dalam beberapa saat, yang akan membolehkan pengguna salin teks dengan cepat daripada apa-apa yang kelihatan pada skrin ke papan keratan sistem, menjadikannya sedia untuk ditampal di tempat lain. Pengecaman aksara, selalunya dikenali sebagai OCR (daripada English Optical Character Recognition), ialah proses yang bertujuan untuk mendigitalkan teks, yang mengenal pasti secara automatik daripada imej, simbol atau aksara yang dimiliki oleh abjad tertentu, dan kemudian menyimpannya sebagai data. Jadi kita boleh berinteraksi dengan ini melalui program penyuntingan teks.
Bagi antara muka apl ini, ia tidak boleh menjadi lebih mudah untuk digunakan. Kami hanya perlu memulakannya, klik pada butang 'Ragut Sekarang!'. Selepas kita akan melihat alat tangkapan skrin lalai muncul untuk mengambil tangkapan skrin penuh, tangkapan tetingkap semasa atau pilih kawasan untuk ditangkap (disyorkan) memfokuskan hanya pada teks yang ingin kita salin.
Ciri umum TextSnatcher
- Program ini akan membolehkan kami salin teks imej dengan mudah, kami boleh melakukan operasi OCR dalam beberapa saat, dengan hasil yang cukup baik.
- Akaun dengan sokongan pelbagai bahasa. Ini boleh dipilih daripada butang di sebelah kiri, di bahagian atas tetingkap.
- Akan membenarkan kita salin teks imej yang membuat pilihan kawasan.
- Ia adalah program yang cepat dan mudah digunakan.
- Boleh jadi lihat beberapa video program ini berfungsi dalam dirinya Repositori GitHub.
- Permohonan ini menggunakan Tesseract OCR 4.x untuk pengecaman aksara. Jika anda berminat untuk mengetahui lebih lanjut, anda boleh membaca tentang Tesseract y Star Tesseract-Projek.
Pasang TextSnatcher pada Ubuntu
Program ini kami boleh menemuinya sebagai pakej Flatpak di Flathub. Sekiranya anda menggunakan Ubuntu 20.04 dan anda masih belum mengaktifkan teknologi ini pada sistem anda, anda boleh meneruskannya Panduannya bahawa rakan sekerja menulis di blog ini sebentar tadi.
kepada pasang program ini pada Ubuntu, kita hanya perlu membuka terminal (Ctrl + Alt + T) dan melaksanakan perintah di dalamnya:
flatpak install flathub com.github.rajsolai.textsnatcher
Apabila pemasangan program selesai, kami hanya perlu mencari pelancar pada komputer kami, atau jalankan di terminal untuk mulakan program:
flatpak run com.github.rajsolai.textsnatcher
Jika selepas memulakan perisian ini, ia tidak berfungsi dengan betul atau ia tidak dimulakan sama sekali, anda mungkin perlu memasang tangkapan skrin gnome. Jika ini berlaku, anda hanya perlu menaip terminal (Ctrl+Alt+T):
sudo apt install gnome-screenshot
Nyahpasang
Sekiranya anda mahu alih keluar program daripada sistem anda, ia hanya perlu membuka terminal (Ctrl+Alt+T) dan melancarkan arahan di dalamnya:
flatpak uninstall com.github.rajsolai.textsnatcher
Alat ini direka untuk sistem pengendalian yang berbeza. Walaupun untuk menulis artikel ini, saya hanya mengujinya pada Ubuntu 20.04/21.10, dengan hasil yang baik dalam kedua-dua kes. motor itu Tesseract OCR menguasakan alat ini dan ia berfungsi dengan baik apabila kawasan yang dipilih adalah resolusi tinggi, atau teks untuk disalin adalah besar dan jelas..
Dalam resolusi rendah atau blok 'teks' yang sangat kecil, sesetengah aksara kadangkala disalin ke yang lebih besar. Juga jika pemilihan mempunyai banyak hiasan, ia boleh membawa kepada beberapa hasil yang tidak dapat difahami, kerana alat itu cuba untuk menetapkan aksara teks ke bahagian sempadan, imej, dsb.