Станете pdf професионалист от терминала на Ubuntu

Терминал с активни цветове

Текстовите документи са доста често срещани документи сред потребителите на Gnu / Linux и компютърния свят ... и с него всички команди и програми, свързани с него. Но в днешно време файловете в pdf формат се налагат над текстовите документи, като са предпочитани за много потребители, разработчици и проекти.

Ако използваме графична среда, използването и управлението на pdf файл е лесноНо Ами ако използваме терминала? След това ви казваме как да манипулирате pdf файлове и да търсите думи, да броите символите в текста на pdf файла и т.н.

За това ще направим използване на командата pdfgrep, команда, която е разклонение на командата grep. Pdfgrep ни позволява да създаваме pdf документи, да изпращаме информация към създадения файл или просто да търсим дума в pdf документ.

Pdfgrep е инструмент, който можем да намерим в официалните хранилища на почти всички дистрибуции, така че за инсталирането му трябва само да използваме софтуерния мениджър на дистрибуцията и да го инсталираме. Може да се случи нашата дистрибуция да не го съдържа (нещо странно, ако използваме Ubuntu). В такъв случай отиваме на официалния уебсайт от разработчика и ще получим пакета deb или rpm за инсталиране.

След като го инсталираме, операцията трябва да бъде следната:

pdfgrep [-v] pattern [archivo.pdf]

В този случай и pdfgrep, и шаблонът са фиксирани команди и [-v] е променливата част, която ще използваме за извършване на операции с pdf файлове, като например търсене на думи, преброяване на знаци и т.н ... [file.pdf] трябва да бъде променен на името на файла, който искаме да използваме или създадем. Ако е в същата папка, в която се намираме, няма да има проблем, но ако pdf файлът е в друга част на компютъра, трябва да посочим адреса на pdf файла, тъй като в противен случай ще има грешка.

Ако наистина използвате командата grep в терминала, ще ви хареса командата pdfgrep. Инструмент, който ще ни позволи генерирайте pdf файлове с информацията на нашия екип и да можете да го изпратите на приятел, техник или друга подобна употреба.


Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорен за данните: Мигел Анхел Гатон
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.

  1.   Джовани Гап каза той

    Те продължават да ми помагат с грешката в BIOS, причинена от Ubuntu, канонично ни изоставят и се преструват, че ни забравят, повредиха новия ми компютър

    1.    Дон Кихот каза той

      и че може би си глупав, ти тролче, че не разбираш, че този блог не принадлежи на канонични проклети субнормални, всеки път, когато видя блога, коментираш глупости, отивай лайна някъде другаде

  2.   Джими Олано каза той

    Току-що инсталирах следната версия на моя Ubuntu 16.04:

    «Това е pdfgrep версия 1.4.1.

    Използване на poppler версия 0.41.0
    Използване на libpcre версия 8.41 2017-07-05 »

    Разбрах, че с параметъра –V (или –version), НО С ПАРАМЕТРА -v МИ КАЗВА, ЧЕ НЕ ГО ПРИЗНАВА.

    За всички тях намирам по-полезна командата -io –ignore-case, която връща ключовата дума, която му предаваме в търсенето, с главни или малки букви.

    ОБАЧЕ ИМА СЕРИОЗЕН ПРОБЛЕМ ЗА ТЪРСЕНЕ НА АКЦЕНТИРАНИ ДУМИ И НАШИЯ ДЪРЖИ ПИСМО, ако искаме да търсим „производство“ или „защита“, трябва да търсим:

    pdfgrep -i producc име_файл.pdf
    pdfgrep -i защита на името на файла.pdf

    (Вече се опитах да го затворя в кавички, единични и двойни, символа за избягване на езика C "\" и заместващи символи и изобщо нищо). За да търся ключовата дума „година“, истината е, че не се сещам за друга алтернатива, който знае нещо, моля, публикувайте тук и моля да ми отговори.

    НАЙ-МОЩНАТА ОПЦИЯ Е -ro –рекурсивна: тя търси думата във ВСИЧКИ pdf документи, които имаме в директорията, по която работим.

    В обобщение, това е добър инструмент и тъй като е написан в безплатен софтуер, можем да го модифицираме, така че да поддържа испански език, благодаря за статията!

  3.   Джими Олано каза той

    ЧЕТЕНЕ НА ТОЗИ ДОКУМЕНТ:

    https://pdfgrep.org/doc.html

    Разбирам и ви уведомявам, че се предлага добавяне на параметър «–unac» за обработка на ударените символи ОБАЧЕ, версията, която изтеглих, нямаше unac поддръжка, защото просто не беше компилирана с тази помощна програма, която те наричат ​​експериментална от начинът.
    Смешното е, че командата grep няма това ограничение, дори когато използвате параметъра -i с grep, човек може да потърси „ú“ и също ще върне „Ú“.

    Във всеки случай вече преглеждам хранилището на pdfgrep, за да видя какво още научавам за него, струва си да не ви безпокоя повече (за днес).