Word een pdf-professional vanuit de Ubuntu-terminal

Terminal met actieve kleuren

Tekstdocumenten zijn vrij algemene documenten onder Gnu / Linux-gebruikers en de computerwereld ... en daarmee alle commando's en programma's die ermee verband houden. Maar tegenwoordig winnen bestanden in pdf-formaat terrein ten opzichte van tekstdocumenten, omdat ze favoriet zijn bij veel gebruikers, ontwikkelaars en projecten.

Als we een grafische omgeving gebruiken, het gebruik en beheer van een pdf-bestand is eenvoudigMaar Wat als we de terminal gebruiken? Vervolgens vertellen we u hoe u pdf-bestanden manipuleert en naar woorden zoekt, de tekens in de tekst van het pdf-bestand telt, enz ...

Hiervoor gaan we doen gebruik van het pdfgrep commando, een commando dat een afsplitsing is van het grep commando​ Met Pdfgrep kunnen we pdf-documenten maken, informatie naar het gemaakte bestand sturen of gewoon zoeken naar een woord in een pdf-document.

Pdfgrep is een tool die we kunnen vinden in de officiële repositories van bijna alle distributies, dus voor de installatie hoeven we alleen de softwaremanager van de distributie te gebruiken en deze te installeren. Het kan gebeuren dat onze distributie het niet bevat (iets vreemds als we Ubuntu gebruiken). In dat geval gaan we naar de officiële website van de ontwikkelaar en we zullen het deb- of rpm-pakket krijgen om te installeren.

Zodra we het hebben geïnstalleerd, moet de bewerking als volgt zijn:

pdfgrep [-v] pattern [archivo.pdf]

In dit geval zijn zowel pdfgrep als pattern vaste commando's en [-v] is het variabele deel dat we zullen gebruiken om bewerkingen uit te voeren met pdf-bestanden, zoals het zoeken naar woorden, het tellen van karakters, etc ... De [file.pdf] moet veranderd worden in de naam van het bestand dat we willen gebruiken of aanmaken. Als het zich in dezelfde map bevindt als wij, is er geen probleem, maar als het pdf-bestand zich in een ander deel van de computer bevindt, moeten we het adres van het pdf-bestand aangeven, omdat er anders een fout optreedt.

Als je echt het grep-commando in de terminal gebruikt, zul je het pdfgrep-commando geweldig vinden. Een tool waarmee we genereer pdf-bestanden met de informatie van ons team en om het naar een vriend, een technicus of ander soortgelijk gebruik te kunnen sturen.


Laat je reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

*

*

  1. Verantwoordelijk voor de gegevens: Miguel Ángel Gatón
  2. Doel van de gegevens: Controle SPAM, commentaarbeheer.
  3. Legitimatie: uw toestemming
  4. Mededeling van de gegevens: De gegevens worden niet aan derden meegedeeld, behalve op grond van wettelijke verplichting.
  5. Gegevensopslag: database gehost door Occentus Networks (EU)
  6. Rechten: u kunt uw gegevens op elk moment beperken, herstellen en verwijderen.

  1.   Giovanni Gapp zei

    Ze blijven me helpen met de BIOS-fout die Ubuntu veroorzaakte, ons canoniek verlaten en doen alsof ze ons vergeten, ze hebben mijn nieuwe computer beschadigd

    1.    Don Quichot zei

      En dat je misschien dom bent, jij stuk trol dat je niet begrijpt dat deze blog niet tot canoniek verdomd subnormaal behoort, elke keer als ik de blog zie, reageer je onzin, ga ergens anders shit

  2.   Jimmy olano zei

    Ik heb zojuist de volgende versie op mijn Ubuntu 16.04 geïnstalleerd:

    «Dit is pdfgrep versie 1.4.1.

    Met behulp van poppler-versie 0.41.0
    Libpcre-versie 8.41 gebruiken 2017-07-05 »

    Ik heb dat met de –V (of –versie) parameter MAAR MET DE -v PARAMETER VERTELT HET ME DAT HET HET NIET HERKENT.

    Ik vind het commando -io –ignore-case nuttiger voor al deze, die het trefwoord dat we eraan doorgeven in zijn zoekopdracht in hoofdletters of kleine letters retourneert.

    HET HEEFT ECHTER EEN ERNSTIG PROBLEEM OM GECONCENTEERDE WOORDEN EN ONZE LIEVE ELKE BRIEF TE ZOEKEN, als we willen zoeken naar «productie» of «bescherming», moeten we zoeken naar:

    pdfgrep -i producc bestandsnaam.pdf
    pdfgrep -i bescherm bestandsnaam.pdf

    (Ik heb al geprobeerd het tussen aanhalingstekens te plaatsen, enkele en dubbele, het C-taal escape-teken "\" en jokertekens en helemaal niets). Om op het trefwoord "jaar" te zoeken, is de waarheid dat ik geen alternatief kan bedenken. Wie iets weet, plaats hier een bericht en beantwoord me alsjeblieft.

    DE MEEST KRACHTIGE OPTIE IS -ro –recursief: het zoekt naar het woord in ALLE pdf-documenten die we hebben in de directory waaraan we werken.

    Samenvattend is het een goede tool en aangezien het in gratis software is geschreven, kunnen we het aanpassen zodat het de Spaanse taal ondersteunt, bedankt voor het artikel!

  3.   Jimmy olano zei

    DIT DOCUMENT LEZEN:

    https://pdfgrep.org/doc.html

    Ik kom erachter en laat je weten dat het wordt voorgesteld om de parameter «–unac» toe te voegen om de tekens met accenten te verwerken. ECHTER, de versie die ik heb gedownload had geen ondersteuning voor unac omdat het simpelweg niet was gecompileerd met dat hulpprogramma, dat ze experimenteel noemen door de weg.
    Het grappige is dat het grep commando die beperking niet heeft, zelfs als je de -i parameter gebruikt met grep kan men zoeken naar "ú" en het zal ook "Ú" teruggeven.

    In ieder geval ben ik de pdfgrep-repository al aan het herzien om te zien wat ik er nog meer over leer, het is de moeite waard om je niet meer lastig te vallen (voor vandaag).