Tule pdf-ammattilaiseksi Ubuntun terminaalista

Pääte aktiivisilla väreillä

Tekstidokumentit ovat melko yleisiä asiakirjoja Gnu / Linux-käyttäjien ja tietokonemaailman keskuudessa ... ja sen mukana kaikki siihen liittyvät komennot ja ohjelmat. Mutta nykyään pdf-muodossa olevat tiedostot ovat saamassa etumatkaa tekstiasiakirjoista, ja ne ovat suosikkeja monille käyttäjille, kehittäjille ja projekteille.

Jos käytämme graafista ympäristöä, pdf-tiedoston käyttö ja hallinta on helppoa, mutta Entä jos käytämme terminaalia? Seuraavaksi kerromme, kuinka käsitellä pdf-tiedostoja ja etsiä sanoja, laskea merkit pdf-tiedoston tekstissä jne ...

Tätä varten aiomme tehdä käyttää pdfgrep-komentoa, komentoa, joka on grep-komennon haarukka. Pdfgrep antaa meille mahdollisuuden luoda pdf-dokumentteja, lähettää tietoja luotuun tiedostoon tai yksinkertaisesti etsiä sanaa pdf-dokumentista.

Pdfgrep on työkalu, joka voimme löytää melkein kaikkien jakelujen virallisista arkistoista, joten sen asentamiseen on käytettävä vain jakelun ohjelmistonhallintaa ja asennettava se. Saattaa käydä niin, että jakelumme ei sisällä sitä (jotain outoa, jos käytämme Ubuntua). Siinä tapauksessa menemme virallisella verkkosivustolla kehittäjältä ja saamme deb- tai rpm-paketin asennettavaksi.

Kun se on asennettu, toiminnan on oltava seuraava:

pdfgrep [-v] pattern [archivo.pdf]

Tässä tapauksessa sekä pdfgrep että kuvio ovat kiinteitä komentoja ja [-v] on muuttujaosa, jota käytämme operaatioiden suorittamiseen pdf-tiedostoilla, kuten sanojen etsiminen, merkkien laskeminen jne. ... [tiedosto.pdf] on vaihdettava käytettävän tai luotavan tiedoston nimeksi. Jos se on samassa kansiossa, jossa olemme, ei ole mitään ongelmaa, mutta jos pdf-tiedosto on tietokoneen toisessa osassa, meidän on ilmoitettava pdf-tiedoston osoite, koska muuten tapahtuu virhe.

Jos todella käytät terminaalin grep-komentoa, rakastat pdfgrep-komentoa. Työkalu, joka antaa meille mahdollisuuden luoda pdf-tiedostoja tiimimme tiedoilla ja pystyä lähettämään se ystävälle, teknikolle tai muuhun vastaavaan käyttöön.


Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

*

*

  1. Vastuussa tiedoista: Miguel Ángel Gatón
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.

  1.   Giovanni gapp dijo

    He auttavat minua edelleen Ubuntun aiheuttamassa BIOS-virheessä, kanoninen hylkää meidät ja teeskentelee unohtavansa he vahingoittivat uutta tietokonettani

    1.    donquijote dijo

      Ja että ehkä olet tyhmä, olet peikko, jota et ymmärrä, että tämä blogi ei kuulu kanoniseen pirun subnormaaliin, aina kun näen blogin, kommentoit paskaa, mene paska jonnekin muualle

  2.   Jimmy Olano dijo

    Asensin juuri seuraavan version Ubuntu 16.04: een:

    «Tämä on pdfgrep-versio 1.4.1.

    Poppler-version 0.41.0 käyttö
    Käyttämällä libpcre-versiota 8.41 2017-07-05 »

    Sain sen parametrilla –V (tai –versio), MUTTA PARAMETRIN KANSSA - v SEN KERROA, ETTÄ EI TUNNISTA sitä.

    Kaikille näille mielestäni komento -io –ignore-case on hyödyllisempi, mikä palauttaa joko isoilla tai pienillä avainsanan, jonka välitämme sille haun yhteydessä.

    Sillä on kuitenkin vakava ongelma etsiä aksenttisia sanoja ja rakasta kirjettä, jos haluamme etsiä sanaa "tuotanto" tai "suojaus", meidän on etsittävä:

    pdfgrep -i producc tiedostonimi.pdf
    pdfgrep -suojaan tiedostonimi.pdf

    (Yritin jo liittää sen lainausmerkkeihin, yksi- ja kaksinkertaiset, C-kielen pakomerkki "\" ja jokerimerkit eikä mitään). Jos haluat etsiä avainsanaa "vuosi", totuus on, että en voi ajatella mitään vaihtoehtoa. Kuka tietää jotain, lähetä tänne ja vastaa minulle.

    TEHOKASIN VAIHTOEHTO ON -ro –rekursiivinen: se etsii sanaa KAIKISTA pdf-tiedostoista, jotka meillä on hakemistossa, jota käsittelemme.

    Yhteenvetona voidaan todeta, että se on hyvä työkalu, ja koska se on kirjoitettu vapaalla ohjelmistolla, voimme muokata sitä niin, että se tukee espanjan kieltä, kiitos artikkelista!

  3.   Jimmy Olano dijo

    TÄMÄN ASIAKIRJAN LUKEMINEN:

    https://pdfgrep.org/doc.html

    Saan selville ja ilmoitan, että ehdotetaan parametrin «–unac» lisäämistä korostettujen merkkien käsittelemiseksi. Lataamallani versiolla ei kuitenkaan ollut Unac-tukea, koska sitä ei yksinkertaisesti käännetty kyseisen apuohjelman kanssa, jota he kutsuvat kokeelliseksi. tavalla.
    Hauska on, että grep-komennolla ei ole tätä rajoitusta, vaikka käytettäessä -i -parametria grepin kanssa voidaan etsiä sanaa "ú" ja se palauttaa myös "Ú".

    Joka tapauksessa olen jo tarkistamassa pdfgrep-arkistoa nähdäksesi mitä muuta opin siitä, kannattaa olla enää häiritsemättä sinua (tänään).