Zostań profesjonalistą w dziedzinie plików PDF z terminala Ubuntu

Terminal z aktywnymi kolorami

Dokumenty tekstowe są dość powszechnymi dokumentami wśród użytkowników Gnu / Linuksa i świata komputerów ... a wraz z nimi wszystkie polecenia i programy z nimi związane. Ale obecnie pliki w formacie pdf zyskują przewagę nad dokumentami tekstowymi, będąc ulubionymi dla wielu użytkowników, programistów i projektów.

Jeśli korzystamy ze środowiska graficznego, używanie i zarządzanie plikiem pdf jest łatwe, ale A jeśli użyjemy terminala? Następnie powiemy, jak manipulować plikami pdf i wyszukiwać słowa, liczyć znaki w tekście pliku pdf itp ...

W tym celu zamierzamy zrobić użycie polecenia pdfgrep, polecenia będącego rozwidleniem polecenia grep. Pdfgrep pozwala nam tworzyć dokumenty pdf, wysyłać informacje do utworzonego pliku lub po prostu wyszukiwać słowo w dokumencie pdf.

Pdfgrep to narzędzie, które możemy znaleźć w oficjalnych repozytoriach prawie wszystkich dystrybucji, więc do jego instalacji wystarczy użyć menedżera oprogramowania dystrybucji i zainstalować go. Może się zdarzyć, że nasza dystrybucja go nie zawiera (coś dziwnego, jeśli używamy Ubuntu). W takim razie idziemy do oficjalna strona internetowa od programisty i otrzymamy pakiet deb lub rpm do zainstalowania.

Po zainstalowaniu operacja musi wyglądać następująco:

pdfgrep [-v] pattern [archivo.pdf]

W tym przypadku zarówno pdfgrep, jak i pattern są stałymi poleceniami i [-v] jest częścią zmiennej, której będziemy używać do wykonywania operacji na plikach pdf, takie jak wyszukiwanie słów, liczenie znaków, itp ... [plik.pdf] należy zmienić na nazwę pliku, który chcemy wykorzystać lub stworzyć. Jeśli jest w tym samym folderze, w którym się znajdujemy, nie będzie problemu, ale jeśli plik pdf znajduje się w innej części komputera, musimy wskazać adres pliku pdf, w przeciwnym razie wystąpi błąd.

Jeśli naprawdę używasz polecenia grep w terminalu, pokochasz polecenie pdfgrep. Narzędzie, które nam pozwoli generować pliki pdf z informacjami naszego zespołu i móc wysłać go znajomemu, technikowi lub w inny podobny sposób.


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Miguel Ángel Gatón
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.

  1.   Giovanni gapp powiedział

    Nadal pomagają mi z błędem BIOS-u, który spowodował Ubuntu, kanoniczny porzucił nas i udaje, że o nas zapomniał, uszkodzili mój nowy komputer

    1.    Don Kichot powiedział

      i że może jesteś głupi, ty trollu, którego nie rozumiesz, że ten blog nie należy do kanonicznego cholernie subnormalnego, za każdym razem, gdy widzę bloga, komentujesz bzdury, idź gówno gdzie indziej

  2.   Jimmy’ego Olano powiedział

    Właśnie zainstalowałem następującą wersję na moim Ubuntu 16.04:

    «To jest pdfgrep w wersji 1.4.1.

    Używam popplera w wersji 0.41.0
    Używam libpcre w wersji 8.41 2017-07-05 »

    Otrzymałem to z parametrem –V (lub –wersja), ALE Z PARAMETREM -v MÓWI, ŻE GO NIE ROZPOZNAWA.

    Do tego wszystkiego bardziej przydatne wydaje mi się polecenie -io –ignore-case, które zwraca słowo kluczowe, które przekazujemy do niego w wyszukiwaniu, pisane wielkimi lub małymi literami.

    JEDNAK POWAŻNY PROBLEM Z WYSZUKIWANIEM SŁÓW AKCENTOWANYCH I NASZEJ DROGI EE LISTY, jeśli chcemy szukać „produkcja” lub „ochrona”, musimy poszukać:

    pdfgrep -i producc nazwa_pliku.pdf
    pdfgrep -i chroń nazwę_pliku.pdf

    (Próbowałem już ująć go w cudzysłów, pojedynczy i podwójny, znak zmiany znaczenia języka C „\” i symbole wieloznaczne i nic). Aby wyszukać słowo kluczowe „rok”, prawda jest taka, że ​​nie mogę wymyślić żadnej alternatywy, ktokolwiek coś wie, napisz tutaj i odpowiedz mi.

    NAJBARDZIEJ POTĘŻNA OPCJA TO -ro –recursive: szuka słowa we WSZYSTKICH dokumentach pdf, które mamy w katalogu, nad którym pracujemy.

    Podsumowując, jest to dobre narzędzie, a ponieważ jest napisane w wolnym oprogramowaniu, możemy je zmodyfikować tak, aby obsługiwało język hiszpański, dzięki za artykuł!

  3.   Jimmy’ego Olano powiedział

    CZYTANIE TEGO DOKUMENTU:

    https://pdfgrep.org/doc.html

    Dowiaduję się i informuję, że proponuje się dodanie parametru «–unac» do obsługi znaków akcentowanych JEDNAK wersja, którą pobrałem, nie miała obsługi unac, ponieważ po prostu nie została skompilowana za pomocą tego narzędzia, które nazywają eksperymentalną.
    Zabawne jest to, że polecenie grep nie ma tego ograniczenia, nawet jeśli używa się parametru -i z grep, można wyszukać "ú", a także zwróci "Ú".

    W każdym razie przeglądam już repozytorium pdfgrep, aby zobaczyć, czego jeszcze się o nim dowiedziałem, nie warto już ci przeszkadzać (na dziś).