Fes-te un professional del pdf des de la terminal d'Ubuntu

Fes-te un professional de l'pdf des de la terminal d'Ubuntu

Els documents de text són documents força habituals entre els usuaris de GNU / Linux i de el món informàtic ... i amb això tots els ordres i programes relacionats amb això. Però avui en dia, els arxius en format pdf estan guanyant terreny als documents de text sent els predilectes per molts usuaris, desenvolupadors i projectes.

Si utilitzem un entorn gràfic, l'usar i administrar un arxiu pdf és fàcil, però ¿I si fem servir la terminal? A continuació us expliquem com poder manipular arxius pdf i buscar paraules, comptar els caràcters de el text de l'arxiu pdf, etc ...

Per a això farem ús de la comanda pdfgrep, una ordre que és un fork de la comanda grep. Pdfgrep ens permet crear documents pdf, enviar informació a l'arxiu creat o simplement buscar una paraula dins d'un document pdf.

Pdfgrep és una eina que podem trobar en els repositoris oficials de gairebé totes les distribucions, De manera que per la seva instal·lació només hem d'utilitzar el gestor de programari de la distribució i instal. Pot passar que la nostra distribució no el contingui, (alguna cosa estranya si utilitzem Ubuntu). En aquest cas ens dirigim a el web oficial de l'desenvolupador i aconseguirem el paquet deb o rpm per instal·lar-lo.

Una vegada que ho tinguem instal·lat, el funcionament ha de ser el següent:

pdfgrep [-v] pattern [archivo.pdf]

En aquest cas, tant pdfgrep com pattern són ordres fixos i [-V] és la part variable que utilitzarem per realitzar operacions amb els arxius pdf, Com buscar paraules, comptar caràcters, etc ... El [arxiu.pdf] s'ha de canviar pel nom de l'arxiu que volem utilitzar o crear. Si aquesta en la mateixa carpeta en la qual estem, no hi haurà problema, però si el fitxer pdf està en una altra part de l'equip, hem d'indicar la direcció de l'arxiu pdf ja que sinó hi haurà un error.

Si realment feu servir la comanda grep a la terminal, la comanda pdfgrep us encantarà. Una eina que ens permetrà generar arxius pdf amb la informació del nostre equip i poder enviar-lo a un amic, un tècnic o qualsevol altre ús similar.

Deixa el teu comentari Cancel lar la resposta

Giovanni Gapp va dir
fa 6 anys

Segueixen si ajudar-me amb l'error de BIOS que va causar Ubuntu, canonical ens abandonament i pretén que se'ns oblidi, van danyar el meu equip nou

Respondre a Giovanni Gapp
1. donquijote va dir
  fa 6 anys
  
  i que potser ets estúpid, tros de troll que no captes que aquest bloc no pertany a canonical maleït subnormal, cada que veig al blog aquestes comentant xorrades camina a cagar a un altre costat
  
  Respondre a donquijote
Jimmy Olano va dir
fa 6 anys

Acabo d'instal·lar la següent versió en la meva Ubuntu 16.04:

«This is pdfgrep versio 1.4.1.

Using Poppler versió 0.41.0
Using libpcre versió 8.41 2017 »

Això ho vaig obtenir amb el paràmetre -V (o -version) PERÒ AMB EL PARÀMETRE -v EM DIU QUE NO HO RECONEIX.

A totes aquestes em sembla més útil la comanda -io -ignore-casi que retorna ja sigui en majúscules o en minúscules la paraula clau que li passem en la seva recerca.

PERÒ TÉ UN GREU PROBLEMA PER A BUSCAR paraules accentuades I LA NOSTRA ESTIMADA LLETRA EÑE, si volem buscar «producció» o «protecció» haurem de buscar:

pdfgrep -i producc nom_fitxer.pdf
pdfgrep -i protecc nom_fitxer.pdf

(Ja vaig intentar tancar entre cometes, simples i dobles, el caràcter fuita de llenguatge C «\» i caràcters comodí i res de res). Per cercar la paraula clau «any» doncs la veritat no se m'acut cap alternativa, qui sàpiga alguna cosa si us plau publiqui per aquí i em respongui si us plau.

L'OPCIÓ MÉS PODEROSA ÉS -RO -recursive: busca la paraula en TOTS els documents pdf que tinguem en el directori que estiguem treballant.

En resum que és una bona eina i com està escrita en programari lliure bé podem modificar perquè suporti l'idioma castellà, gràcies per l'article!

Respondre a Jimmy Olano
Jimmy Olano va dir
fa 6 anys

LLEGINT AQUEST DOCUMENT:

https://pdfgrep.org/doc.html

m'assabento i us dono a conèixer que està plantejat afegir el paràmetre «-unac» per gestionar els caràcters accentuats PERÒ la versió que vaig descarregar no tenia suport UNAC perquè simplement no va ser compilada amb aquesta utilleria, que de passada denominen experimental.
EL CURIÓS DEL ASSUMPTE és que la comanda grep no té aquesta limitació, fins i tot a l'utilitzar amb grep el paràmetre -i un pot buscar «ú» i també retornarà «Ú».

En tot cas ja estic revisant el repositori de pdfgrep a veure que més aprenc a l'respecte, val no us moelsto més (per ara).

Respondre a Jimmy Olano