Besedilni dokumenti so med uporabniki Gnu / Linuxa in računalniškim svetom zelo pogosti dokumenti ... z njimi pa tudi vsi ukazi in programi, povezani z njim. Toda dandanes se datoteke v obliki pdf uveljavljajo nad besedilnimi dokumenti in so priljubljene za številne uporabnike, razvijalce in projekte.
Če uporabljamo grafično okolje, uporaba in upravljanje datoteke pdf je enostavnaVendar Kaj če uporabimo terminal? Nato vam povemo, kako upravljati datoteke PDF in iskati besede, šteti znake v besedilu datoteke PDF itd.
Za to bomo storili uporaba ukaza pdfgrep, ukaza, ki je vilica ukaza grep. Pdfgrep nam omogoča ustvarjanje dokumentov pdf, pošiljanje informacij v ustvarjeno datoteko ali preprosto iskanje besede v dokumentu pdf.
Pdfgrep je orodje, ki najdemo v uradnih skladiščih skoraj vseh distribucij, zato moramo za njegovo namestitev uporabiti le programski upravitelj distribucije in jo namestiti. Lahko se zgodi, da ga naša distribucija ne vsebuje (nekaj čudnega, če uporabljamo Ubuntu). V tem primeru gremo do na uradni spletni strani od razvijalca in dobili bomo paket deb ali rpm za namestitev.
Ko ga namestimo, mora biti postopek naslednji:
pdfgrep [-v] pattern [archivo.pdf]
V tem primeru sta pdfgrep in vzorec fiksna ukaza in [-v] je spremenljivi del, s katerim bomo izvajali operacije s pdf datotekami, na primer iskanje besed, štetje znakov itd ... [datoteko.pdf] je treba spremeniti v ime datoteke, ki jo želimo uporabiti ali ustvariti. Če je v isti mapi, kjer smo, ne bo težav, če pa je datoteka pdf v drugem delu računalnika, moramo navesti naslov datoteke pdf, saj bo sicer prišlo do napake.
Če res uporabljate ukaz grep v terminalu, vam bo všeč ukaz pdfgrep. Orodje, ki nam bo omogočilo ustvarite datoteke pdf z informacijami naše ekipe in da ga lahko pošljete prijatelju, tehniku ali kateri koli drugi podobni uporabi.
Še naprej mi pomagajo pri napaki BIOS-a, ki jo je povzročil Ubuntu, nas kanonično zapustijo in se pretvarjajo, da nas pozabljajo, poškodovali so moj novi računalnik
in da si morda neumen, ti trolski košček, da ne razumeš, da ta blog ne spada v kanonično prekleto subnormalno, vsakič ko vidim blog, ki ga komentiraš, sranje, sranje nekam drugam
Pravkar sem v svoj Ubuntu 16.04 namestil naslednjo različico:
«To je pdfgrep, različica 1.4.1.
Uporaba popplerja različice 0.41.0
Uporaba libpcre različice 8.41 2017-07-05 »
To sem dobil s parametrom –V (ali –version), PA V PARAMETRU -v MI POVE, DA GA NE PRIZNA.
Za vse te se mi zdi bolj koristen ukaz -io –ignore-case, ki vrne z velikimi ali malimi črkami ključno besedo, ki ji jo prosimo pri iskanju.
Vendar pa ima resen problem iskati naglasne besede in naše spoštovane črke, če želimo iskati "proizvodnjo" ali "zaščito", moramo iskati:
pdfgrep -i producc ime datoteke.pdf
pdfgrep -i zaščitim ime datoteke.pdf
(Poskušal sem ga zapirati v narekovaje, enojne in dvojne, ubežni znak C \ "in nadomestne znake ter nič). Če iščem ključno besedo "leto", resnica je, da si ne predstavljam druge možnosti. Kdor kaj ve, prosim objavite sem in mi odgovorite.
NAJMOČNEJŠA MOŽNOST JE -ro –rekurzivna: išče besedo v VSEH pdf dokumentih, ki jih imamo v imeniku, s katerim delamo.
Če povzamemo, je dobro orodje in ker je napisano v brezplačni programski opremi, ga lahko spremenimo tako, da podpira španski jezik, hvala za članek!
PREBERITE TEGA DOKUMENTA:
https://pdfgrep.org/doc.html
Ugotovim in vas obvestim, da je predlagano dodajanje parametra «–unac» za ravnanje s poudarjenimi znaki, VSAKO pa različica, ki sem jo prenesel, ni imela unac podpore, ker preprosto ni bila prevedena s tem pripomočkom, ki mu pravijo eksperimentalni pot.
Smešno je, da ukaz grep nima te omejitve, tudi če pri parametru grep uporabite parameter -i, lahko poiščete "ú" in vrnil bo tudi "Ú".
Vsekakor že pregledam repozitorij pdfgrep, da vidim, kaj še o tem izvem, vredno vas ne moti več (za danes).