gImageReader, приложение PDF с возможностями оптического распознавания символов

В следующей статье мы рассмотрим gImageReader. Это приложение передняя часть для двигателя Tesseract OCR. Для тех, кто не знаком с Tesseract, скажем, что это механизм оптического распознавания символов (OCR), который использует искусственный интеллект для поиска и распознавания текста, напечатанного на изображениях. Это библиотека с открытым исходным кодом и одна из самых популярных систем распознавания текста на рынке. Упростите весь процесс извлечения печатного текста из изображений позволяя пользователям работать с файлами, отсканированными изображениями, PDF-файлами, вставленными элементами из буфера обмена и т. д.

Сегодня все пользователи, будь то в офисах, домах и т. Д., Могут оказаться в ситуации, когда нам нужно извлечь текст из изображения. Это может быть отсканированный документ в формате изображения, лист бумаги или старая исследовательская работа. Вариант, который выберут многие пользователи, - это набрать весь текст с помощью редактора, но этот процесс может занять много времени. Чтобы избежать этой работы, мы также можем выбрать вариант использовать OCR для автоматического извлечения текста.

gImageReader предложит нам множество функций и инструментов. Это приложение - хороший инструмент для использования после импорта PDF или отсканированный документ и его дальнейшая обработка.

Общие возможности GImageReader

Мы сможем импортировать PDF-документы и изображения с диска, сканирующих устройств, буфера обмена и снимков экрана. gImageReader поддерживает множество типов файлов. Нам просто нужно будет импортировать наши файлы в инструмент и извлекать текст одним щелчком мыши.
У нас будет возможность создавать PDF-документы из hOCR-документов. gImageReader поддерживает три извлеченных текстовых формата: простой текст, PDF и формат hOCR.
Инструмент даст нам возможность определить ручную или автоматическую область распознавания , чтобы выделить текст для извлечения.
Распознанный текст отображается непосредственно рядом с изображением. Как вы можете видеть на скриншоте выше.
После извлечения в обычный текст gImageReader выполняет действия постобработки, такие как проверка орфографии. В зависимости от выбранного языка (по умолчанию - All English), подчеркнет слова, содержащие грамматические ошибки. Кроме того, gImageReader позволяет нам выбрать режим сегментации страницы, который мы хотим использовать для извлеченного текста.
В отличие от других инструментов OCR, где мы можем работать с одним файлом за раз, gImageReader поддерживает импорт большого количества файлов и их пакетная обработкаs.

Об этой программе мы можем получить дополнительную информацию или любое новое обновление на их официальной странице GitHub.

Установка на Ubuntu

Это мультиплатформенное приложение и он работает как в Gnu / Linux, так и в Windows. В следующих строках мы увидим процесс установки gImageReader в Ubuntu 18.04, как указано в страница проекта на GitHub.

Добавить PPA

Для этого программного обеспечения нам понадобится добавить репозиторий PPA в нашу систему. Мы сделаем это, открыв терминал (Ctrl + Alt + T) и набрав следующую команду:

sudo add-apt-repository ppa:sandromani/gimagereader

Установить gImageReader

После того, как обновление программного обеспечения доступно, теперь мы можем приступить к установке приложения набрав в том же терминале:

sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng

Со всем вышеперечисленным gImageReader следует установить на вашем Ubuntu. Теперь у нас должна быть возможность запустить программу на нашем компьютере.

деинсталляция

Если мы хотим удалить gImageReader, в терминале (Ctrl + Alt + T) нам нужно будет использовать только следующую команду:

sudo apt-get remove gimagereader -y

Чтобы завершить удаление программы, мы также можем выполнить:

sudo apt-get autoremove

PPA, который мы используем для установки, можно удалить из нашей системы, набрав в том же терминале:

sudo add-apt-repository -r ppa:sandromani/gimagereader

gImageReader - это простой интерфейсный Gtk / Qt для Тессеракт-OCR Это упрощает весь процесс извлечения печатного текста из изображений. Это позволит нам работать с файлами, отсканированными изображениями, PDF, вставленными элементами из буфера обмена и т. Д. Это делает его хорошим вариантом легко и быстро извлекать текст из изображений.

Оставьте свой комментарий Отменить ответ

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

комментарий *

Имя*

Электронная почта*

Принять условия конфиденциальности*

Ответственный за данные: Мигель Анхель Гатон
Назначение данных: контроль спама, управление комментариями.
Легитимация: ваше согласие
Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.

Я хочу получать рассылку новостей

Ubunlog

gImageReader, приложение PDF с функцией распознавания текста