Word een PDF-professional vanaf de Ubuntu-terminal

Word een pdf-professional vanuit de Ubuntu-terminal

Tekstdocumenten zijn vrij algemene documenten onder Gnu / Linux-gebruikers en de computerwereld ... en daarmee alle commando's en programma's die ermee verband houden. Maar tegenwoordig winnen bestanden in pdf-formaat terrein ten opzichte van tekstdocumenten, omdat ze favoriet zijn bij veel gebruikers, ontwikkelaars en projecten.

Als we een grafische omgeving gebruiken, het gebruik en beheer van een pdf-bestand is eenvoudigMaar Wat als we de terminal gebruiken? Vervolgens vertellen we u hoe u pdf-bestanden manipuleert en naar woorden zoekt, de tekens in de tekst van het pdf-bestand telt, enz ...

Hiervoor gaan we doen gebruik van het pdfgrep commando, een commando dat een afsplitsing is van het grep commando Met Pdfgrep kunnen we pdf-documenten maken, informatie naar het gemaakte bestand sturen of gewoon zoeken naar een woord in een pdf-document.

Pdfgrep is een tool die we kunnen vinden in de officiële repositories van bijna alle distributies, dus voor de installatie hoeven we alleen de softwaremanager van de distributie te gebruiken en deze te installeren. Het kan gebeuren dat onze distributie het niet bevat (iets vreemds als we Ubuntu gebruiken). In dat geval gaan we naar de officiële website van de ontwikkelaar en we zullen het deb- of rpm-pakket krijgen om te installeren.

Zodra we het hebben geïnstalleerd, moet de bewerking als volgt zijn:

pdfgrep [-v] pattern [archivo.pdf]

In dit geval zijn zowel pdfgrep als pattern vaste commando's en [-v] is het variabele deel dat we zullen gebruiken om bewerkingen uit te voeren met pdf-bestanden, zoals het zoeken naar woorden, het tellen van karakters, etc ... De [file.pdf] moet veranderd worden in de naam van het bestand dat we willen gebruiken of aanmaken. Als het zich in dezelfde map bevindt als wij, is er geen probleem, maar als het pdf-bestand zich in een ander deel van de computer bevindt, moeten we het adres van het pdf-bestand aangeven, omdat er anders een fout optreedt.

Als je echt het grep-commando in de terminal gebruikt, zul je het pdfgrep-commando geweldig vinden. Een tool waarmee we genereer pdf-bestanden met de informatie van ons team en om het naar een vriend, een technicus of ander soortgelijk gebruik te kunnen sturen.

Laat je reactie achter Antwoord annuleren

Giovanni Gapp zei
geleden Tot 6 jaar

Ze blijven me helpen met de BIOS-fout die Ubuntu veroorzaakte, ons canoniek verlaten en doen alsof ze ons vergeten, ze hebben mijn nieuwe computer beschadigd

Reageer op Giovanni Gapp
1. Don Quichot zei
  geleden Tot 6 jaar
  
  En dat je misschien dom bent, jij stuk trol dat je niet begrijpt dat deze blog niet tot canoniek verdomd subnormaal behoort, elke keer als ik de blog zie, reageer je onzin, ga ergens anders shit
  
  Reageer op donquijote
Jimmy olano zei
geleden Tot 6 jaar

Ik heb zojuist de volgende versie op mijn Ubuntu 16.04 geïnstalleerd:

«Dit is pdfgrep versie 1.4.1.

Met behulp van poppler-versie 0.41.0
Libpcre-versie 8.41 gebruiken 2017-07-05 »

Ik heb dat met de –V (of –versie) parameter MAAR MET DE -v PARAMETER VERTELT HET ME DAT HET HET NIET HERKENT.

Ik vind het commando -io –ignore-case nuttiger voor al deze, die het trefwoord dat we eraan doorgeven in zijn zoekopdracht in hoofdletters of kleine letters retourneert.

HET HEEFT ECHTER EEN ERNSTIG PROBLEEM OM GECONCENTEERDE WOORDEN EN ONZE LIEVE ELKE BRIEF TE ZOEKEN, als we willen zoeken naar «productie» of «bescherming», moeten we zoeken naar:

pdfgrep -i producc bestandsnaam.pdf
pdfgrep -i bescherm bestandsnaam.pdf

(Ik heb al geprobeerd het tussen aanhalingstekens te plaatsen, enkele en dubbele, het C-taal escape-teken "\" en jokertekens en helemaal niets). Om op het trefwoord "jaar" te zoeken, is de waarheid dat ik geen alternatief kan bedenken. Wie iets weet, plaats hier een bericht en beantwoord me alsjeblieft.

DE MEEST KRACHTIGE OPTIE IS -ro –recursief: het zoekt naar het woord in ALLE pdf-documenten die we hebben in de directory waaraan we werken.

Samenvattend is het een goede tool en aangezien het in gratis software is geschreven, kunnen we het aanpassen zodat het de Spaanse taal ondersteunt, bedankt voor het artikel!

Reageer op Jimmy Olano
Jimmy olano zei
geleden Tot 6 jaar

DIT DOCUMENT LEZEN:

https://pdfgrep.org/doc.html

Ik kom erachter en laat je weten dat het wordt voorgesteld om de parameter «–unac» toe te voegen om de tekens met accenten te verwerken. ECHTER, de versie die ik heb gedownload had geen ondersteuning voor unac omdat het simpelweg niet was gecompileerd met dat hulpprogramma, dat ze experimenteel noemen door de weg.
Het grappige is dat het grep commando die beperking niet heeft, zelfs als je de -i parameter gebruikt met grep kan men zoeken naar "ú" en het zal ook "Ú" teruggeven.

In ieder geval ben ik de pdfgrep-repository al aan het herzien om te zien wat ik er nog meer over leer, het is de moeite waard om je niet meer lastig te vallen (voor vandaag).

Reageer op Jimmy Olano