Pada artikel berikutnya kita akan melihat TextSnatcher. Jika Anda adalah salah satu pengguna yang biasanya bekerja dengan OCR, Anda mungkin ingin melihat aplikasi sederhana yang dibangun di atas aplikasi kompleks yang hebat seperti ini tesseract. jika Anda mencari cara mudah dan tidak rumit untuk menyalin teks dari gambar di Gnu/Linux, Anda dapat melihat TextSnatcher, mungkin cocok dengan apa yang Anda cari.
Kemungkinan ekstrak teks dari gambar, file PDF atau hal serupa, bukanlah hal baru. Hari ini kita dapat menemukan banyak alat berbeda untuk melakukan pekerjaan ini, tetapi saat ini tidak ada yang melakukannya semudah TextSnatcher.
Alat ini melakukan pengenalan karakter optik (OCR) dalam hitungan detik, yang memungkinkan pengguna salin teks dengan cepat dari apa pun yang terlihat di layar ke papan klip sistem, membuatnya siap untuk ditempel di tempat lain. Pengenalan karakter, sering dikenal sebagai OCR (dari Pengenalan Karakter Optik Bahasa Inggris), adalah proses yang bertujuan untuk mendigitalkan teks, yang secara otomatis mengidentifikasi dari suatu gambar, simbol, atau karakter yang termasuk dalam alfabet tertentu, dan kemudian menyimpannya sebagai data. Jadi kita bisa berinteraksi dengan ini melalui program penyuntingan teks.
Adapun antarmuka aplikasi ini, tidak bisa lebih mudah untuk digunakan. Kita hanya perlu memulainya, klik tombol 'Snatch Now!'. Setelah kita akan melihat alat tangkapan layar default muncul untuk mengambil tangkapan layar penuh, tangkapan jendela saat ini atau pilih area untuk ditangkap (direkomendasikan) hanya berfokus pada teks yang ingin kita salin.
Fitur umum TextSnatcher
- Program ini akan memungkinkan kita menyalin teks gambar dengan mudah, kita dapat melakukan operasi OCR dalam hitungan detik, dengan hasil yang cukup baik.
- Akun dengan dukungan beberapa bahasa. Ini dapat dipilih dari tombol di sisi kiri, di bagian atas jendela.
- Akan mengizinkan kita salin teks gambar membuat pilihan area.
- Hal ini program yang cepat dan mudah digunakan.
- Anda bisa lihat beberapa video dari program ini bekerja dalam Surat Repositori GitHub.
- Aplikasi ini menggunakan Tesseract OCR 4.x untuk pengenalan karakter. Jika Anda tertarik untuk mengetahui lebih banyak, Anda dapat membaca tentang tesseract y Bintang Proyek Tesseract.
Instal TextSnatcher di Ubuntu
Program ini kami dapat menemukannya tersedia sebagai paket Flatpak di Flathub. Jika Anda menggunakan Ubuntu 20.04 dan Anda masih belum mengaktifkan teknologi ini di sistem Anda, Anda dapat melanjutkan Petunjuk yang ditulis oleh seorang kolega di blog ini beberapa waktu yang lalu.
untuk instal program ini di Ubuntu, kita hanya perlu membuka terminal (Ctrl + Alt + T) dan menjalankan perintah di dalamnya:
flatpak install flathub com.github.rajsolai.textsnatcher
Ketika instalasi program selesai, kita hanya perlu mencari peluncur di komputer kita, atau menjalankan di terminal untuk memulai program:
flatpak run com.github.rajsolai.textsnatcher
Jika setelah memulai perangkat lunak ini, itu tidak berfungsi dengan benar atau tidak memulai sama sekali, Anda mungkin perlu menginstal gnome-screenshot. Jika ini masalahnya, yang harus Anda lakukan adalah mengetikkan terminal (Ctrl+Alt+T):
sudo apt install gnome-screenshot
Copot pemasangan
Jika Anda mau hapus program dari sistem Anda, hanya perlu membuka terminal (Ctrl+Alt+T) dan meluncurkan perintah di dalamnya:
flatpak uninstall com.github.rajsolai.textsnatcher
Alat ini dirancang untuk sistem operasi yang berbeda. Meskipun untuk menulis artikel ini, saya hanya mengujinya di Ubuntu 20.04/21.10, dengan hasil yang baik di kedua kasus. Motornya Tesseract OCR mendukung alat ini dan berfungsi dengan baik saat area yang dipilih beresolusi tinggi, atau teks yang akan disalin berukuran besar dan jelas..
Dalam resolusi rendah atau blok 'teks' yang sangat kecil, beberapa karakter terkadang disalin ke yang lebih besar. Juga jika pemilihan memiliki banyak hiasan, itu dapat menyebabkan beberapa hasil yang tidak dapat dipahami, karena alat ini mencoba menetapkan karakter teks ke bagian batas, gambar, dll.