Legyen pdf-szakember az Ubuntu terminálról

Aktív színű terminál

A szöveges dokumentumok meglehetősen gyakori dokumentumok a Gnu / Linux felhasználók és a számítógépes világ körében ... és ezzel együtt az összes kapcsolódó parancs és program. De manapság a pdf formátumú fájlok egyre nagyobb teret hódítanak a szöveges dokumentumokhoz képest, amelyek sok felhasználó, fejlesztő és projekt számára a kedvencek.

Ha grafikus környezetet használunk, a pdf fájl használata és kezelése egyszerű, de Mi van, ha használjuk a terminált? Ezután elmondjuk, hogyan kell kezelni a pdf fájlokat és keresni a szavakat, megszámolni a karaktereket a pdf fájl szövegében stb.

Ehhez fogunk tenni a pdfgrep parancs használata, amely a grep parancs elágazása. A Pdfgrep lehetővé teszi számunkra, hogy pdf dokumentumokat hozzunk létre, információkat küldjünk a létrehozott fájlba, vagy egyszerűen keressünk egy szót egy pdf dokumentumban.

A Pdfgrep egy olyan eszköz, amely szinte az összes disztribúció hivatalos tárházában megtalálhatjuk, ezért telepítéséhez csak a disztribúció szoftverkezelőjét kell használnunk és telepítenünk. Előfordulhat, hogy a disztribúciónk nem tartalmazza (valami furcsa, ha az Ubuntut használjuk). Ebben az esetben megyünk a hivatalos honlapon a fejlesztőtől, és megkapjuk a deb vagy rpm csomagot telepítésre.

Miután telepítettük, a műveletnek a következőknek kell lennie:

pdfgrep [-v] pattern [archivo.pdf]

Ebben az esetben a pdfgrep és a minta is fix parancsok és A [-v] az a változó rész, amelyet a fájlokkal végzett műveletek végrehajtására használunk, például szavak keresése, karakterek számlálása stb. ... A [file.pdf] fájlt át kell állítani a használni kívánt vagy létrehozandó fájl nevére. Ha ugyanabban a mappában van, ahol vagyunk, akkor nem lesz probléma, de ha a pdf fájl a számítógép másik részén található, meg kell adnunk a pdf fájl címét, mivel különben hiba lesz.

Ha valóban a terminálban használja a grep parancsot, imádni fogja a pdfgrep parancsot. Egy eszköz, amely lehetővé teszi számunkra generáljon pdf fájlokat a csapatunk információival és elküldeni egy barátjának, technikusnak vagy bármilyen más hasonló célra.


A cikk tartalma betartja a szerkesztői etika. A hiba bejelentéséhez kattintson a gombra itt.

4 hozzászólás, hagyd a tiedet

Hagyja megjegyzését

E-mail címed nem kerül nyilvánosságra.

*

*

  1. Az adatokért felelős: Miguel Ángel Gatón
  2. Az adatok célja: A SPAM ellenőrzése, a megjegyzések kezelése.
  3. Legitimáció: Az Ön beleegyezése
  4. Az adatok közlése: Az adatokat csak jogi kötelezettség alapján továbbítjuk harmadik felekkel.
  5. Adattárolás: Az Occentus Networks (EU) által üzemeltetett adatbázis
  6. Jogok: Bármikor korlátozhatja, helyreállíthatja és törölheti adatait.

  1.   Giovanni gapp dijo

    Továbbra is segítenek az Ubuntu által okozott BIOS-hibában, a kanonikusok elhagynak minket, és úgy tesznek, mintha elfelejtettek volna minket, megrongálták az új számítógépemet

    1.    Don Quijote dijo

      És hogy talán hülye vagy, te egy darab troll, hogy nem érted, hogy ez a blog nem tartozik kanonikus átkozottul normális dologhoz, valahányszor látom a blogot, te marhaságokat mondasz baromságok

  2.   Jimmy Olano dijo

    Most telepítettem a következő verziót az Ubuntu 16.04-re:

    «Ez az 1.4.1 pdfgrep verzió.

    A popler 0.41.0 verziójának használata
    A libpcre 8.41 verziójának használata 2017-07-05 »

    Ezt a –V (vagy –verzió) paraméterrel kaptam, DE A -v PARAMÉTERRŐL MEGÁLLAPÍTJA, HOGY NEM FELISMERI.

    Mindezeknél hasznosabbnak találom az -io –ignore-case parancsot, amely nagybetűvel vagy kisbetűvel adja vissza azt a kulcsszót, amelyet a keresés során átadunk neki.

    NAGYON PROBLÉMÁJA VAN AZ AKCIÓS SZAVAK ÉS KEDVES E-LEVELÜNK KERESÉSÉRE, ha a «gyártás» vagy a «védelem» kifejezésre akarunk keresni, meg kell keresnünk:

    pdfgrep -i producc fájlnév.pdf
    pdfgrep -a fájlnév védelme.pdf

    (Már megpróbáltam idézőjelekbe foglalni, egyszemélyes és kettős, a C nyelvű "\" menekülési karaktert és a helyettesítő karaktereket, és semmit sem). Az "év" kulcsszó keresésére az az igazság, hogy nem jut eszembe alternatíva, aki tud valamit, kérem, tegye ide, és válaszoljon.

    A leghatékonyabb opció IS -ro –rekurzív: MINDEN pdf dokumentumban megkeresi azt a szót, amely a könyvtárban van, amin dolgozunk.

    Összefoglalva, ez egy jó eszköz, és mivel szabad szoftverben van megírva, úgy módosíthatjuk, hogy támogassa a spanyol nyelvet, köszönöm a cikket!

  3.   Jimmy Olano dijo

    EZT A DOKUMENTUM OLVASÁSA:

    https://pdfgrep.org/doc.html

    Megtudtam, és tudatom veled, hogy javasolt az «–unac» paraméter hozzáadása az ékezetes karakterek kezeléséhez. A letöltött verziónak azonban nem volt unac támogatása, mert egyszerűen nem azzal a segédprogrammal fordították össze, amelyet az út.
    A vicces dolog az, hogy a grep parancsnak nincs ilyen korlátozása, még akkor is, ha az -i paramétert a grep-lel együtt használjuk, az "ú" kifejezésre lehet keresni, és az "Ú" -t is visszaadja.

    Mindenesetre már átnézem a pdfgrep adattárat, hogy megtudjam, mit tudok még róla, érdemes már nem zavarni (a mai napig).