Текстовите документи са доста често срещани документи сред потребителите на Gnu / Linux и компютърния свят ... и с него всички команди и програми, свързани с него. Но в днешно време файловете в pdf формат се налагат над текстовите документи, като са предпочитани за много потребители, разработчици и проекти.
Ако използваме графична среда, използването и управлението на pdf файл е лесноНо Ами ако използваме терминала? След това ви казваме как да манипулирате pdf файлове и да търсите думи, да броите символите в текста на pdf файла и т.н.
За това ще направим използване на командата pdfgrep, команда, която е разклонение на командата grep. Pdfgrep ни позволява да създаваме pdf документи, да изпращаме информация към създадения файл или просто да търсим дума в pdf документ.
Pdfgrep е инструмент, който можем да намерим в официалните хранилища на почти всички дистрибуции, така че за инсталирането му трябва само да използваме софтуерния мениджър на дистрибуцията и да го инсталираме. Може да се случи нашата дистрибуция да не го съдържа (нещо странно, ако използваме Ubuntu). В такъв случай отиваме на официалния уебсайт от разработчика и ще получим пакета deb или rpm за инсталиране.
След като го инсталираме, операцията трябва да бъде следната:
pdfgrep [-v] pattern [archivo.pdf]
В този случай и pdfgrep, и шаблонът са фиксирани команди и [-v] е променливата част, която ще използваме за извършване на операции с pdf файлове, като например търсене на думи, преброяване на знаци и т.н ... [file.pdf] трябва да бъде променен на името на файла, който искаме да използваме или създадем. Ако е в същата папка, в която се намираме, няма да има проблем, но ако pdf файлът е в друга част на компютъра, трябва да посочим адреса на pdf файла, тъй като в противен случай ще има грешка.
Ако наистина използвате командата grep в терминала, ще ви хареса командата pdfgrep. Инструмент, който ще ни позволи генерирайте pdf файлове с информацията на нашия екип и да можете да го изпратите на приятел, техник или друга подобна употреба.
Те продължават да ми помагат с грешката в BIOS, причинена от Ubuntu, канонично ни изоставят и се преструват, че ни забравят, повредиха новия ми компютър
и че може би си глупав, ти тролче, че не разбираш, че този блог не принадлежи на канонични проклети субнормални, всеки път, когато видя блога, коментираш глупости, отивай лайна някъде другаде
Току-що инсталирах следната версия на моя Ubuntu 16.04:
«Това е pdfgrep версия 1.4.1.
Използване на poppler версия 0.41.0
Използване на libpcre версия 8.41 2017-07-05 »
Разбрах, че с параметъра –V (или –version), НО С ПАРАМЕТРА -v МИ КАЗВА, ЧЕ НЕ ГО ПРИЗНАВА.
За всички тях намирам по-полезна командата -io –ignore-case, която връща ключовата дума, която му предаваме в търсенето, с главни или малки букви.
ОБАЧЕ ИМА СЕРИОЗЕН ПРОБЛЕМ ЗА ТЪРСЕНЕ НА АКЦЕНТИРАНИ ДУМИ И НАШИЯ ДЪРЖИ ПИСМО, ако искаме да търсим „производство“ или „защита“, трябва да търсим:
pdfgrep -i producc име_файл.pdf
pdfgrep -i защита на името на файла.pdf
(Вече се опитах да го затворя в кавички, единични и двойни, символа за избягване на езика C "\" и заместващи символи и изобщо нищо). За да търся ключовата дума „година“, истината е, че не се сещам за друга алтернатива, който знае нещо, моля, публикувайте тук и моля да ми отговори.
НАЙ-МОЩНАТА ОПЦИЯ Е -ro –рекурсивна: тя търси думата във ВСИЧКИ pdf документи, които имаме в директорията, по която работим.
В обобщение, това е добър инструмент и тъй като е написан в безплатен софтуер, можем да го модифицираме, така че да поддържа испански език, благодаря за статията!
ЧЕТЕНЕ НА ТОЗИ ДОКУМЕНТ:
https://pdfgrep.org/doc.html
Разбирам и ви уведомявам, че се предлага добавяне на параметър «–unac» за обработка на ударените символи ОБАЧЕ, версията, която изтеглих, нямаше unac поддръжка, защото просто не беше компилирана с тази помощна програма, която те наричат експериментална от начинът.
Смешното е, че командата grep няма това ограничение, дори когато използвате параметъра -i с grep, човек може да потърси „ú“ и също ще върне „Ú“.
Във всеки случай вече преглеждам хранилището на pdfgrep, за да видя какво още научавам за него, струва си да не ви безпокоя повече (за днес).