Diventa un professionista del pdf dal terminale Ubuntu

Terminale con colori attivi

I documenti di testo sono documenti abbastanza comuni tra gli utenti di Gnu / Linux e il mondo dei computer ... e con essi tutti i comandi e programmi ad esso correlati. Ma oggigiorno, i file in formato pdf stanno guadagnando terreno sui documenti di testo, essendo i preferiti da molti utenti, sviluppatori e progetti.

Se utilizziamo un ambiente grafico, utilizzare e gestire un file pdf è facile, Ma E se usiamo il terminale? Successivamente ti diciamo come manipolare i file pdf e cercare parole, contare i caratteri nel testo del file pdf, ecc ...

Per questo lo faremo uso del comando pdfgrep, un comando che è un fork del comando grep. Pdfgrep ci permette di creare documenti pdf, inviare informazioni al file creato o semplicemente cercare una parola all'interno di un documento pdf.

Pdfgrep è uno strumento che possiamo trovare nei repository ufficiali di quasi tutte le distribuzioni, quindi per la sua installazione dobbiamo solo utilizzare il software manager della distribuzione e installarlo. Può succedere che la nostra distribuzione non lo contenga (cosa strana se usiamo Ubuntu). In tal caso andiamo a il sito ufficiale dallo sviluppatore e otterremo il pacchetto deb o rpm da installare.

Una volta installato, l'operazione deve essere la seguente:

pdfgrep [-v] pattern [archivo.pdf]

In questo caso, sia pdfgrep che pattern sono comandi fissi e [-v] è la parte variabile che useremo per eseguire operazioni con i file pdf, come la ricerca di parole, il conteggio dei caratteri, ecc ... Il [file.pdf] deve essere cambiato con il nome del file che vogliamo utilizzare o creare. Se è nella stessa cartella in cui ci troviamo non ci saranno problemi, ma se il file pdf è in un'altra parte del computer, dobbiamo indicare l'indirizzo del file pdf altrimenti ci sarà un errore.

Se usi davvero il comando grep nel terminale, adorerai il comando pdfgrep. Uno strumento che ce lo permetterà generare file pdf con le informazioni del nostro team e di poterlo inviare ad un amico, a un tecnico o ad altro uso simile.


Lascia un tuo commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *

*

*

  1. Responsabile dei dati: Miguel Ángel Gatón
  2. Scopo dei dati: controllo SPAM, gestione commenti.
  3. Legittimazione: il tuo consenso
  4. Comunicazione dei dati: I dati non saranno oggetto di comunicazione a terzi se non per obbligo di legge.
  5. Archiviazione dati: database ospitato da Occentus Networks (UE)
  6. Diritti: in qualsiasi momento puoi limitare, recuperare ed eliminare le tue informazioni.

  1.   Giovanni gapp suddetto

    Continuano ad aiutarmi con l'errore del BIOS causato da Ubuntu, i canonici ci abbandonano e fanno finta di dimenticarci, hanno danneggiato il mio nuovo computer

    1.    Don Chisciotte suddetto

      E che forse sei stupido, pezzo di troll che non capisci che questo blog non appartiene a canonici dannatamente subnormali, ogni volta che vedo il blog stai commentando cazzate vai di merda da qualche altra parte

  2.   Jimmy Olano suddetto

    Ho appena installato la seguente versione sul mio Ubuntu 16.04:

    «Questa è la versione pdfgrep 1.4.1.

    Utilizzando poppler versione 0.41.0
    Utilizzo della versione 8.41 di libpcre 2017/07/05 »

    L'ho ottenuto con il parametro –V (o –version) MA CON IL PARAMETRO -v MI DICE CHE NON LO RICONOSCE.

    A tutti questi trovo più utile il comando -io –ignore-case, che restituisce in maiuscolo o minuscolo la parola chiave che gli passiamo nella sua ricerca.

    TUTTAVIA, HA UN GRAVE PROBLEMA RICERCARE PAROLE ACCENTATE E LA NOSTRA CARA EÑE LETTERA, se vogliamo cercare «produzione» o «protezione» dobbiamo cercare:

    pdfgrep -i producc nomefile.pdf
    pdfgrep -i protegge il nomefile.pdf

    (Ho già provato a racchiuderlo tra virgolette, singole e doppie, il carattere di escape del linguaggio C "\" e caratteri jolly e niente affatto). Per cercare la parola chiave "anno", la verità è che non riesco a pensare ad alcuna alternativa, chi sa qualcosa per favore posta qui e per favore rispondimi.

    L'OPZIONE PIÙ POTENTE È -ro –recursive: cerca la parola in TUTTI i documenti pdf che abbiamo nella directory su cui stiamo lavorando.

    In sintesi, è un buon strumento e poiché è scritto in software libero, possiamo modificarlo in modo che supporti la lingua spagnola, grazie per l'articolo!

  3.   Jimmy Olano suddetto

    LEGGERE QUESTO DOCUMENTO:

    https://pdfgrep.org/doc.html

    Scopro e ti faccio sapere che si propone di aggiungere il parametro «–unac» per gestire i caratteri accentati TUTTAVIA, la versione che ho scaricato non aveva il supporto per unac perché semplicemente non era stata compilata con quell'utility, che chiamano sperimentale la via.
    La cosa divertente è che il comando grep non ha questa limitazione, anche quando si usa il parametro -i con grep si può cercare "ú" e restituirà anche "Ú".

    In ogni caso sto già rivedendo il repository pdfgrep per vedere cos'altro ho imparato al riguardo, vale la pena non disturbarti più (per oggi).