Staňte sa profesionálom vo formáte PDF z terminálu Ubuntu

Terminál s aktívnymi farbami

Textové dokumenty sú medzi používateľmi GNU / Linuxu a počítačovým svetom úplne bežné dokumenty ... a s nimi aj všetky súvisiace príkazy a programy. V dnešnej dobe sa však súbory vo formáte PDF dostávajú nad textové dokumenty a sú obľúbenými pre mnohých používateľov, vývojárov a projekty.

Ak používame grafické prostredie, použitie a správa súboru PDF je jednoducháAle Čo ak použijeme terminál? Ďalej vám povieme, ako manipulovať so súbormi PDF a hľadať slová, počítať znaky v texte súboru PDF atď.

Z tohto dôvodu urobíme použitie príkazu pdfgrep, príkazu, ktorý je vidlicou príkazu grep. Pdfgrep nám umožňuje vytvárať dokumenty PDF, posielať informácie do vytvoreného súboru alebo jednoducho vyhľadávať slovo v dokumente PDF.

Pdfgrep je nástroj, ktorý nájdeme v oficiálnych úložiskách takmer všetkých distribúcií, takže na jeho inštaláciu musíme použiť iba softvérového manažéra distribúcie a nainštalovať ho. Môže sa stať, že to naša distribúcia neobsahuje (niečo zvláštne, ak používame Ubuntu). V takom prípade ideme na oficiálna webová stránka od vývojára a dostaneme balík deb alebo rpm na inštaláciu.

Po nainštalovaní musí byť operácia nasledovná:

pdfgrep [-v] pattern [archivo.pdf]

V tomto prípade sú pdfgrep aj pattern pevné príkazy a [-v] je variabilná časť, ktorú použijeme na vykonávanie operácií so súbormi pdf, ako napríklad hľadanie slov, počítanie znakov atď. Súbor [file.pdf] musí byť zmenený na názov súboru, ktorý chceme použiť alebo vytvoriť. Ak je v rovnakom priečinku, v ktorom sa nachádzame, nebude problém, ale ak sa súbor pdf nachádza v inej časti počítača, musíme uviesť adresu súboru pdf, pretože inak by došlo k chybe.

Ak v termináli naozaj použijete príkaz grep, bude sa vám páčiť príkaz pdfgrep. Nástroj, ktorý nám to umožní generujte súbory PDF s informáciami nášho tímu a vedieť ho poslať priateľovi, technikovi alebo na iné podobné účely.


Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Zodpovedný za údaje: Miguel Ángel Gatón
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.

  1.   Giovanni gapp dijo

    Naďalej mi pomáhajú s chybou BIOSu, ktorú spôsobil Ubuntu, kanonicky nás opustia a predstierajú, že na nás zabudli, poškodili môj nový počítač

    1.    Don Quijote dijo

      a že si možno hlúpy, ty trol, že nechápeš, že tento blog nepatrí do kánonickej sakra podnormality, vždy, keď vidím ten blog, komentuješ kecy, choď srať niekam inam

  2.   Jimmy olano dijo

    Na svoj Ubuntu 16.04 som práve nainštaloval nasledujúcu verziu:

    «Toto je pdfgrep verzia 1.4.1.

    Používanie verzie poppler 0.41.0
    Používanie libpcre verzie 8.41 2017-07-05 »

    Dostal som to s parametrom –V (alebo –verzia), ALE S PARAMETROM -v MI TO POVEDÁ, ŽE TO NEUZNÁVA.

    Pre všetky tieto považujem za užitočnejší príkaz -io –ignore-case, ktorý vráti veľké alebo malé písmeno kľúčového slova, ktoré mu pri hľadaní odovzdáme.

    MUSÍ však VŠAK VÁŽNY PROBLÉM VYHĽADÁVAŤ PRÍSLUŠNÉ SLOVA A NAŠE MILÉ EÑE LISTY, ak chceme hľadať «výrobu» alebo «ochranu», musíme hľadať:

    pdfgrep -i producc nazov souboru.pdf
    pdfgrep -i chrániť názov súboru.pdf

    (Už som to skúsil vložiť do úvodzoviek, jednoduchých a dvojitých, únikového znaku v jazyku C „\“ a zástupných znakov a vôbec nič). Ak hľadám kľúčové slovo „rok“, pravdou je, že ma nenapadá žiadna alternatíva, kto niečo vie, uverejnite ho tu a odpovedzte mi.

    NAJVÝKONNEJŠIA MOŽNOSŤ JE -ro –rekurzívna: hľadá slovo vo VŠETKÝCH dokumentoch pdf, ktoré máme v adresári, na ktorom pracujeme.

    Stručne povedané, je to dobrý nástroj a keďže je napísaný v slobodnom softvéri, môžeme ho upraviť tak, aby podporoval španielsky jazyk, vďaka za článok!

  3.   Jimmy olano dijo

    ČÍTANIE TOHTO DOKUMENTU:

    https://pdfgrep.org/doc.html

    Zistil som a dáme vám vedieť, že sa navrhuje pridať parameter «–unac» na manipuláciu so znakmi s prízvukom HOWEVER. Verzia, ktorú som si stiahol, však nemala podporu bez aplikácie, pretože to jednoducho nebolo zostavené s týmto nástrojom, ktorý nazývajú experimentálnym cesta.
    Zábavné je, že príkaz grep nemá toto obmedzenie, aj keď pri použití parametra -i s grepom možno vyhľadať „ú“ a vráti tiež „Ú“.

    V každom prípade už skúmam úložisko pdfgrep, aby som zistil, čo sa o ňom ešte dozviem, stojí za to vás už neobťažovať (pre dnešok).