В следующей статье мы рассмотрим TextSnatcher. Если вы один из пользователей, которые обычно работают с OCR, возможно, вы хотели бы увидеть простое приложение, созданное поверх такого замечательного сложного приложения, как это. Тессеракт, Если вы ищете простой и несложный способ копирования текста с изображений в Gnu/Linux, вы можете взглянуть на TextSnatcher, он может подойти для того, что вы ищете.
Возможность извлекать текст из изображений, PDF-файлов или подобных вещей, ничего нового. Сегодня мы можем найти множество различных инструментов для выполнения этой работы, но на данный момент ни один из них не делает это так легко, как TextSnatcher.
Этот инструмент выполняет оптическое распознавание символов (OCR) за секунды, что позволит пользователям быстро копировать текст из всего, что видно на экране, в системный буфер обмена, делая его готовым к вставке в другое место. Распознавание символов, часто известное как OCR (с английского оптического распознавания символов), представляет собой процесс, направленный на оцифровку текстов, которые автоматически идентифицируют по изображению, символам или символам, принадлежащим к определенному алфавиту, и затем сохраняют их в виде данных. Таким образом, мы можем взаимодействовать с ними через программу редактирования текста.
Что касается интерфейса этого приложения, то его очень легко использовать. Нам останется только запустить его, нажав на кнопку «Схватить сейчас!». После мы увидим инструмент захвата экрана по умолчанию, чтобы сделать полный снимок экрана, захват текущего окна или выбрать область для захвата (рекомендуемый), ориентируясь только на текст, который мы хотим скопировать.
Общие характеристики TextSnatcher
- Эта программа позволит нам легко копировать текст изображений, мы можем выполнять операции OCR за считанные секунды, с довольно хорошими результатами.
- Учетная запись поддержка нескольких языков. Их можно выбрать с помощью кнопки слева в верхней части окна.
- Позволит нам скопируйте текст изображений, выделив область.
- Есть быстрая и простая в использовании программа.
- Май посмотрите несколько видео работы этой программы ан су Репозиторий GitHub.
- Это приложение использует Tesseract OCR 4.x для распознавания символов. Если вам интересно узнать больше, вы можете прочитать о Тессеракт y Звездный Тессеракт-Проект.
Установите TextSnatcher на Ubuntu
Эта программа мы можем найти его в виде пакета Flatpak по адресу Flathub. Если вы используете Ubuntu 20.04 и в вашей системе по-прежнему не включена эта технология, вы можете продолжить гид что коллега написал в этом блоге некоторое время назад.
к установить эту программу на Ubuntu, нам останется только открыть терминал (Ctrl + Alt + T) и выполнить в нем команду:
flatpak install flathub com.github.rajsolai.textsnatcher
Когда установка программы будет завершена, нам останется только найти программу запуска на нашем компьютере или запустить в терминале, чтобы запустить программу:
flatpak run com.github.rajsolai.textsnatcher
Если после запуска этого программного обеспечения оно работает некорректно или вообще не запускается, возможно, вам потребуется установить гном-скриншот. Если это так, все, что вам нужно сделать, это ввести терминал (Ctrl+Alt+T):
sudo apt install gnome-screenshot
деинсталляция
Если хочешь удалить программу из вашей системы, нужно будет только открыть терминал (Ctrl+Alt+T) и запустить в нем команду:
flatpak uninstall com.github.rajsolai.textsnatcher
Этот инструмент предназначен для разных операционных систем. Хотя для написания этой статьи я протестировал ее только на Ubuntu 20.04/21.10, и в обоих случаях получил хорошие результаты. Мотор Tesseract OCR поддерживает этот инструмент, и он отлично работает, когда выделенная область имеет высокое разрешение или текст для копирования большой и четкий..
В низком разрешении или очень маленьких блоках «текста» некоторые символы иногда копируются в более крупные. Также, если в выделении много украшений, это может привести к непонятным результатам, так как инструмент пытается присвоить текстовые символы частям границ, изображениям и т. д.
Будьте первым, чтобы комментировать