在下一篇文章中,我們將看看 TextSnatcher。 如果您是通常與之合作的用戶之一 OCR,您可能希望看到一個簡單的應用程序構建在這樣一個非常複雜的應用程序之上 正方體. 如果你正在尋找 在 Gnu/Linux 中從圖像中復製文本的簡單方法,你可以看看TextSnatcher,它可能適合你正在尋找的東西。
可能性 從圖像、PDF 文件或類似內容中提取文本,不是什麼新鮮事。 今天我們可以找到許多不同的工具來完成這項工作,但目前沒有一個工具能像 TextSnatcher 那樣簡單。
該工具執行光學字符識別(OCR) 在幾秒鐘內,這將允許用戶 快速將屏幕上可見的任何文本複製到系統剪貼板,準備好粘貼到其他地方. 字符識別,通常稱為 OCR (來自英文光學字符識別),是一個旨在將文本數字化的過程,它從圖像中自動識別屬於某個字母的符號或字符,然後將它們存儲為數據。 所以我們可以通過文本編輯程序與這些交互。
至於這個應用程序的界面,使用起來再簡單不過了。 我們只需啟動它,單擊“立即搶奪!”按鈕。 後 我們會看到默認的截屏工具出現進行全屏截屏,截取當前窗口或選擇要截取的區域 (推薦的) 只關注我們要復制的文本。
TextSnatcher 的一般特性
- 該計劃將使我們 輕鬆複製圖片文字,秒級OCR操作,效果相當不錯。
- 帳戶 多語言支持. 這些可以從窗口頂部左側的按鈕中選擇。
- 將允許我們 複製圖像的文本以選擇區域.
- 這是 一個快速且易於使用的程序.
- 你可以 看這個程序工作的一些視頻 在其 GitHub資料庫.
- 這個應用程序 使用 Tesseract OCR 4.x 進行字符識別. 如果您有興趣了解更多信息,可以閱讀關於 正方體 y Star Tesseract-項目.
在 Ubuntu 上安裝 TextSnatcher
這個程序 我們可以在以下位置找到它以 Flatpak 包的形式提供 Flathub. 如果您使用 Ubuntu 20.04 並且您的系統上仍未啟用此技術,您可以繼續 導遊 一位同事不久前在此博客上寫道。
至 在 Ubuntu 上安裝這個程序,我們只需要打開一個終端(Ctrl + Alt + T)並在其中執行命令:
flatpak install flathub com.github.rajsolai.textsnatcher
程序安裝完成後,我們只需要在電腦上尋找啟動器,或者在終端中運行即可 啟動程序:
flatpak run com.github.rajsolai.textsnatcher
如果啟動此軟件後無法正常運行或根本無法啟動,則可能需要安裝 GNOME的屏幕截圖. 如果是這種情況,您只需輸入終端 (Ctrl+Alt+T):
sudo apt install gnome-screenshot
卸載
萬一你想要 從系統中刪除程序,只需要打開一個終端(Ctrl+Alt+T)並在其中啟動命令:
flatpak uninstall com.github.rajsolai.textsnatcher
該工具專為不同的操作系統而設計。 雖然為了寫這篇文章,我只在 Ubuntu 20.04/21.10 上進行了測試,兩種情況下都取得了不錯的效果。 電機 Tesseract OCR 為該工具提供支持,當所選區域為高分辨率或要復制的文本大而清晰時,它的效果很好。.
在低分辨率或非常小的“文本”塊中,某些字符有時會復製到較大的. 此外,如果選擇有很多裝飾,可能會導致一些難以理解的結果,因為該工具會嘗試將文本字符分配給邊框、圖像等的部分。