Станьте PDF-професіоналом із терміналу Ubuntu

Станьте професіоналом PDF у терміналі Ubuntu

Текстові документи - це досить поширені документи серед користувачів Gnu / Linux та комп’ютерного світу ... а разом з ними і всі команди та програми, пов’язані з цим. Але в наш час файли у форматі PDF набирають популярності над текстовими документами, будучи улюбленими для багатьох користувачів, розробників та проектів.

Якщо ми використовуємо графічне середовище, користуватися файлом PDF та керувати ним легко, але Що робити, якщо ми використовуємо термінал? Далі ми розповімо вам, як маніпулювати PDF-файлами та шукати слова, підраховувати символи у тексті PDF-файлу тощо ...

Для цього ми будемо робити використання команди pdfgrep, команди, яка є форком команди grep. Pdfgrep дозволяє нам створювати PDF-документи, надсилати інформацію до створеного файлу або просто шукати слово в документі PDF.

Pdfgrep - це інструмент, який ми можемо знайти в офіційних сховищах майже всіх дистрибутивів, тож для його встановлення нам потрібно лише використовувати менеджер програмного забезпечення дистрибутива та встановити його. Може трапитися так, що наш дистрибутив його не містить (щось дивне, якщо ми використовуємо Ubuntu). У такому випадку ми йдемо до офіційний веб-сайт від розробника, і ми отримаємо пакет deb або rpm для встановлення.

Після того, як ми його встановимо, операція повинна бути наступною:

pdfgrep [-v] pattern [archivo.pdf]

У цьому випадку і pdfgrep, і шаблон є фіксованими командами та [-v] - це змінна частина, яку ми будемо використовувати для виконання операцій з файлами PDF, як пошук слів, підрахунок символів тощо ... [файл.pdf] потрібно змінити на ім'я файлу, який ми хочемо використати або створити. Якщо він знаходиться в тій самій папці, в якій ми знаходимося, проблем не виникне, але якщо файл pdf знаходиться в іншій частині комп'ютера, ми повинні вказати адресу pdf-файлу, інакше буде помилка.

Якщо ви дійсно використовуєте команду grep у терміналі, вам сподобається команда pdfgrep. Інструмент, який нам дозволить генерувати PDF-файли з інформацією нашої команди і мати можливість надіслати його другові, техніку чи будь-якому іншому подібному використанню.

Залиште свій коментар Скасувати відповідь

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

коментар *

Ім'я*

електронна пошта*

Я приймаю умови конфіденційності*

Відповідальний за дані: Мігель Анхель Гатон
Призначення даних: Контроль спаму, управління коментарями.
Легітимація: Ваша згода
Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.

Я хочу отримувати бюлетень

Джованні Гапп - сказав він
тому 6 років

Вони продовжують допомагати мені з помилкою BIOS, яку спричинила Ubuntu, канонічно кидають нас і роблять вигляд, що забули нас, вони пошкодили мій новий комп'ютер

Відповідь Джованні Гаппу
1. Дон Кіхот - сказав він
  тому 6 років
  
  І що, можливо, ти дурний, ти троле тролю, що ти не розумієш, що цей блог не належить канонічному проклятому дебілу, кожен раз, коли я бачу щоденник, що ти коментуєш фігню, піди лай кудись ще
  
  Відповісти donquijote
Джиммі Олано - сказав він
тому 6 років

Я щойно встановив наступну версію на своєму Ubuntu 16.04:

«Це pdfgrep версія 1.4.1.

Використання poppler версії 0.41.0
Використання libpcre версії 8.41 2017-07-05 »

Я зрозумів, що з параметром –V (або –version), АЛЕ З ПАРАМЕТРОМ -v він говорить мені, що він цього не визнає.

Для всіх них я вважаю більш корисною команду -io –ignore-case, яка повертає або у верхньому, або в нижньому регістрі ключове слово, яке ми передаємо йому під час пошуку.

Втім, вона має серйозну проблему з пошуком наголошених слів та нашого дорогого листа, якщо ми хочемо шукати «виробництво» або «захист», ми повинні шукати:

pdfgrep -i producc ім'я_файла.pdf
pdfgrep -i захищаю ім'я файлу.pdf

(Я вже намагався вкласти його в лапки, одинарне та подвійне, символ "\" символу введення мови "C" та символи підстановки та взагалі нічого). Для пошуку за ключовим словом "рік", правда полягає в тому, що я не можу придумати жодної альтернативи, хто знає щось, будь ласка, напишіть тут і будь ласка, дайте мені відповідь.

НАЙМОЩІШИЙ ВАРІАНТ - -ro –рекурсивний: він шукає слово у ВСІХ документах pdf, які ми маємо в каталозі, над яким ми працюємо.

Таким чином, це хороший інструмент, і оскільки він написаний у вільному програмному забезпеченні, ми можемо його змінити так, щоб він підтримував іспанську мову, дякую за статтю!

Відповідь Джиммі Олано
Джиммі Олано - сказав він
тому 6 років

ЧИТАННЯ ЦЬОГО ДОКУМЕНТУ:

https://pdfgrep.org/doc.html

Я з'ясовую і повідомляю вам, що пропонується додати параметр «–unac» для обробки наголошених символів, ОДНО, версія, яку я завантажив, не мала підтримку unac, оскільки вона просто не була скомпільована з цією утилітою, яку вони називають експериментальною шлях.
Найцікавіше, що команда grep не має цього обмеження, навіть коли за допомогою параметра -i з grep можна шукати "ú", і вона також поверне "Ú".

У будь-якому випадку, я вже переглядаю сховище pdfgrep, щоб побачити, що ще я про це дізнаюся, добре, я вас більше не турбую (на сьогодні)

Відповідь Джиммі Олано