Staňte se profesionálem ve formátu PDF z terminálu Ubuntu

Terminál s aktivními barvami

Textové dokumenty jsou docela běžné dokumenty mezi uživateli GNU / Linuxu a počítačovým světem ... as nimi všechny související příkazy a programy. V dnešní době se však soubory ve formátu PDF prosazují nad textovými dokumenty, které jsou oblíbenými pro mnoho uživatelů, vývojářů a projektů.

Pokud použijeme grafické prostředí, používání a správa souboru PDF je snadnéAle Co když použijeme terminál? Dále vám řekneme, jak manipulovat se soubory PDF a hledat slova, počítat znaky v textu souboru PDF atd ...

K tomu uděláme použití příkazu pdfgrep, což je vidlice příkazu grep. Pdfgrep nám umožňuje vytvářet dokumenty PDF, odesílat informace do vytvořeného souboru nebo jednoduše vyhledat slovo v dokumentu PDF.

Pdfgrep je nástroj, který můžeme najít v oficiálních úložištích téměř všech distribucí, takže pro jeho instalaci musíme použít pouze softwarového správce distribuce a nainstalovat jej. Může se stát, že to naše distribuce neobsahuje (něco zvláštního, pokud používáme Ubuntu). V tom případě jdeme na oficiální web od vývojáře a my si necháme nainstalovat balíček deb nebo rpm.

Jakmile to máme nainstalované, operace musí být následující:

pdfgrep [-v] pattern [archivo.pdf]

V tomto případě jsou pdfgrep i pattern pevné příkazy a [-v] je variabilní část, kterou použijeme k provádění operací se soubory PDF, jako je hledání slov, počítání znaků atd ... [file.pdf] musí být změněn na název souboru, který chceme použít nebo vytvořit. Pokud je ve stejné složce, kde jsme, nebude to žádný problém, ale pokud je soubor pdf v jiné části počítače, musíme uvést adresu souboru pdf, protože jinak by došlo k chybě.

Pokud opravdu používáte příkaz grep v terminálu, bude se vám líbit příkaz pdfgrep. Nástroj, který nám to umožní generujte soubory PDF s informacemi našeho týmu a mít možnost jej poslat známému, technikovi nebo jinému podobnému použití.


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Odpovědný za údaje: Miguel Ángel Gatón
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.

  1.   Giovanni gapp řekl

    Stále mi pomáhají s chybou BIOSu, kterou Ubuntu způsobil, kanonicky nás opustil a předstírá, že na nás zapomněl, poškodili můj nový počítač

    1.    Don Quijote řekl

      a že možná jsi hloupý, ty trolle, že nechápeš, že tento blog nepatří do kanonicky zatraceného podnormálu, pokaždé, když vidím ten blog, komentuješ kecy jdi do prdele někam jinam

  2.   Jimmy olano řekl

    Právě jsem nainstaloval následující verzi na můj Ubuntu 16.04:

    «Toto je pdfgrep verze 1.4.1.

    Používání poppleru verze 0.41.0
    Používání libpcre verze 8.41 2017-07-05 »

    Dostal jsem to s parametrem –V (nebo –verze), ALE S PARAMETREM -v MNĚ TO ŘÍKÁ, ŽE TO NEZNAMENÁ

    Pro všechny tyto považuji za užitečnější příkaz -io –ignore-case, který vrací buď velká nebo malá písmena klíčové slovo, které mu při hledání předáme.

    MÁTE VÁŽ, ŽE VÁŽNÝ PROBLÉM VYHLEDÁVAT PŘÍSLUŠNÁ SLOVA A NAŠE VÁŽNÁ EÑE LIST, chceme-li hledat «výrobu» nebo «ochranu», musíme hledat:

    pdfgrep -i producc název_souboru.pdf
    pdfgrep -i chránit název souboru.pdf

    (Už jsem to zkusil uvést v uvozovkách, jednoduchých a dvojitých, únikovém znaku jazyka C "\" a zástupných znacích a vůbec nic). Při hledání klíčového slova „rok“ je pravda, že mě nenapadá žádná alternativa, kdokoli něco ví, prosím pošlete sem a odpovězte mi.

    NEJMOCNĚJŠÍ MOŽNOST JE -ro – rekurzivní: hledá slovo ve VŠECH dokumentech pdf, které máme v adresáři, na kterém pracujeme.

    Stručně řečeno, je to dobrý nástroj a protože je napsán ve svobodném softwaru, můžeme jej upravit tak, aby podporoval španělský jazyk, díky za článek!

  3.   Jimmy olano řekl

    ČTENÍ TOHOTO DOKUMENTU:

    https://pdfgrep.org/doc.html

    Zjistil jsem a dám vám vědět, že se navrhuje přidat parametr «–unac», aby zvládl znaky s diakritikou HOWEVER, verze, kterou jsem stáhl, však neměla nepřijatelnou podporu, protože to prostě nebylo kompilováno s tímto nástrojem, který nazývají experimentálním cesta.
    Zábavné je, že příkaz grep toto omezení nemá, i když při použití parametru -i s grepem lze hledat „ú“ a vrátí také „Ú“.

    V každém případě již přezkoumávám repozitář pdfgrep, abych zjistil, co dalšího se o něm dozvídám, stojí za to vás už neobtěžovat (pro dnešek).