Станьте профессионалом в области pdf из терминала Ubuntu

Терминал с активными цветами

Текстовые документы - довольно распространенные документы среди пользователей Gnu / Linux и компьютерного мира ... а вместе с ним и всех команд и программ, связанных с ним. Но в настоящее время файлы в формате pdf все больше преобладают над текстовыми документами, являясь фаворитами многих пользователей, разработчиков и проектов.

Если мы используем графическую среду, использовать PDF-файл и управлять им легко, Но Что, если мы воспользуемся терминалом? Далее мы расскажем вам, как управлять файлами pdf и искать слова, подсчитывать символы в тексте файла pdf и т. Д.

Для этого мы собираемся сделать использование команды pdfgrep, которая является ответвлением команды grep. Pdfgrep позволяет нам создавать PDF-документы, отправлять информацию в созданный файл или просто искать слово в PDF-документе.

Pdfgrep - это инструмент, который мы можем найти в официальных репозиториях практически всех дистрибутивов, поэтому для его установки нам нужно только использовать программный менеджер дистрибутива и установить его. Может случиться так, что в нашем дистрибутиве его нет (что-то странно, если мы используем Ubuntu). В этом случае мы переходим к официальный сайт от разработчика, и мы получим пакет deb или rpm для установки.

После того, как мы его установили, операция должна быть следующей:

pdfgrep [-v] pattern [archivo.pdf]

В этом случае и pdfgrep, и шаблон являются фиксированными командами и [-v] - это переменная часть, которую мы будем использовать для выполнения операций с файлами pdf., например, поиск слов, подсчет символов и т. д. [file.pdf] должен быть изменен на имя файла, который мы хотим использовать или создать. Если он находится в той же папке, что и мы, проблем не возникнет, но если файл pdf находится в другой части компьютера, мы должны указать адрес файла pdf, иначе будет ошибка.

Если вы действительно используете команду grep в терминале, вам понравится команда pdfgrep. Инструмент, который позволит нам сгенерировать pdf файлы с информацией нашей команды и иметь возможность отправить его другу, техническому специалисту или любому другому аналогичному использованию.


4 комментариев, оставьте свой

Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: Мигель Анхель Гатон
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.

  1.   Джованни гапп сказал

    Они продолжают помогать мне с ошибкой BIOS, вызванной Ubuntu, канонически бросают нас и делают вид, что забыли нас, они повредили мой новый компьютер

    1.    donquijote сказал

      И что, возможно, ты тупой, кусок тролля, что ты не понимаешь, что этот блог не принадлежит к каноническим чертовски субнормальным, каждый раз, когда я вижу блог, который ты комментируешь, херня иди в другое место

  2.   Джимми Олано сказал

    Я только что установил на свой Ubuntu 16.04 следующую версию:

    «Это pdfgrep версии 1.4.1.

    Использование poppler версии 0.41.0
    Использование libpcre версии 8.41 2017 »

    Я получил это с параметром –V (или –version), НО С ПАРАМЕТРОМ -v ОНО СКАЗЫВАЕТ, ЧТО ЭТО НЕ ПРИЗНАЕТ.

    Для всего этого я считаю более полезной команду -io –ignore-case, которая возвращает либо в верхнем, либо в нижнем регистре ключевое слово, которое мы передаем ему при поиске.

    ОДНАКО ЕСТЬ СЕРЬЕЗНАЯ ПРОБЛЕМА ПОИСКА АКЦЕНТОВАННЫХ СЛОВ И НАШЕГО ДОРОГОГО ПИСЬМА, если мы хотим искать «продукцию» или «защиту», мы должны искать:

    pdfgrep -i producc имя_файла.pdf
    pdfgrep -i защитить имя файла.pdf

    (Я уже пробовал заключать его в кавычки, одинарные и двойные, escape-символ языка C "\" и символы подстановки, и вообще ничего). Для поиска по ключевому слову «год», правда в том, что я не могу придумать никакой альтернативы, кто бы ни знал что-то, напишите здесь и, пожалуйста, ответьте мне.

    САМЫЙ МОЩНЫЙ ВАРИАНТ ЯВЛЯЕТСЯ -ro –рекурсивным: он ищет слово во ВСЕХ PDF-документах, которые есть в каталоге, над которым мы работаем.

    Таким образом, это хороший инструмент, и, поскольку он написан на бесплатном программном обеспечении, мы можем изменить его так, чтобы он поддерживал испанский язык, спасибо за статью!

  3.   Джимми Олано сказал

    ЧТЕНИЕ ДАННОГО ДОКУМЕНТА:

    https://pdfgrep.org/doc.html

    Я узнал и сообщаю вам, что предлагается добавить параметр «–unac» для обработки акцентированных символов ОДНАКО версия, которую я скачал, не имела поддержки unac, потому что она просто не была скомпилирована с помощью этой утилиты, которую они называют экспериментальной. способ.
    Забавно то, что команда grep не имеет этого ограничения, даже при использовании параметра -i с grep можно искать «ú», и он также вернет «Ú».

    В любом случае я уже просматриваю репозиторий pdfgrep, чтобы узнать, что еще я узнаю о нем, не стоит больше беспокоить вас (на сегодня).