Devenez un professionnel du PDF depuis le terminal Ubuntu

Terminal avec couleurs actives

Les documents texte sont des documents assez courants parmi les utilisateurs de Gnu / Linux et le monde informatique ... et avec eux toutes les commandes et programmes qui y sont liés. Mais de nos jours, les fichiers au format pdf gagnent du terrain par rapport aux documents texte, étant les favoris de nombreux utilisateurs, développeurs et projets.

Si nous utilisons un environnement graphique, l'utilisation et la gestion d'un fichier pdf sont facilesmais Et si nous utilisons le terminal? Ensuite, nous vous expliquons comment manipuler les fichiers pdf et rechercher des mots, compter les caractères dans le texte du fichier pdf, etc ...

Pour cela nous allons faire utilisation de la commande pdfgrep, une commande qui est un fork de la commande grep. Pdfgrep nous permet de créer des documents pdf, d'envoyer des informations au fichier créé ou simplement de rechercher un mot dans un document pdf.

Pdfgrep est un outil qui on peut trouver dans les référentiels officiels de presque toutes les distributions, donc pour son installation, nous n'avons qu'à utiliser le gestionnaire de logiciels de la distribution et à l'installer. Il peut arriver que notre distribution ne le contienne pas, (chose étrange si nous utilisons Ubuntu). Dans ce cas, nous allons à le site officiel du développeur et nous obtiendrons le package deb ou rpm à installer.

Une fois que nous l'avons installé, l'opération doit être la suivante:

pdfgrep [-v] pattern [archivo.pdf]

Dans ce cas, pdfgrep et pattern sont des commandes fixes et [-v] est la partie variable que nous allons utiliser pour effectuer des opérations avec des fichiers pdf, comme la recherche de mots, le comptage des caractères, etc ... Le [fichier.pdf] doit être remplacé par le nom du fichier que nous voulons utiliser ou créer. S'il se trouve dans le même dossier où nous sommes, il n'y aura pas de problème, mais si le fichier pdf est dans une autre partie de l'ordinateur, nous devons indiquer l'adresse du fichier pdf car sinon il y aura une erreur.

Si vous utilisez vraiment la commande grep dans le terminal, vous allez adorer la commande pdfgrep. Un outil qui nous permettra générer des fichiers pdf avec les informations de notre équipe et pouvoir l'envoyer à un ami, à un technicien ou à toute autre utilisation similaire.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données: Miguel Ángel Gatón
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.

  1.   giovanni gapp dit

    Ils continuent de m'aider avec l'erreur BIOS qu'Ubuntu a causée, canonique nous a abandonnés et fait semblant de nous oublier, ils ont endommagé mon nouvel ordinateur

    1.    Don Quichotte dit

      Et que peut-être que tu es stupide, espèce de troll que tu ne comprends pas que ce blog n'appartient pas à la putain de canon canonique subnormal, à chaque fois que je vois le blog tu commentes des conneries aller chier ailleurs

  2.   Jimmy Olano dit

    Je viens d'installer la version suivante sur mon Ubuntu 16.04:

    «Il s'agit de la version 1.4.1 de pdfgrep.

    Utilisation de la version 0.41.0 de Poppler
    Utilisation de la version 8.41 de libpcre 2017/07/05 »

    Je l'ai obtenu avec le paramètre –V (ou –version) MAIS AVEC LE PARAMÈTRE -v, IL M'INDIQUE QU'IL NE LE RECONNAÎT PAS.

    Pour tous ceux-ci je trouve la commande -io –ignore-case plus utile, qui renvoie soit en majuscules soit en minuscules le mot-clé que nous lui passons dans sa recherche.

    TOUTEFOIS, IL A UN GRAVE PROBLEME DE RECHERCHER DES MOTS ACCENTÉS ET NOTRE CHER EÑE LETTRE, si nous voulons rechercher «production» ou «protection» il faut chercher:

    pdfgrep -i producc nom_fichier.pdf
    pdfgrep -i protéger nomfichier.pdf

    (J'ai déjà essayé de le mettre entre guillemets, simples et doubles, le caractère d'échappement du langage C "\" et les caractères génériques et rien du tout). Pour rechercher le mot-clé "année", la vérité est que je ne peux pas penser à aucune alternative, quiconque sait quelque chose s'il vous plaît postez ici et répondez-moi s'il vous plaît.

    L'OPTION LA PLUS PUISSANTE EST -ro –recursive: elle recherche le mot dans TOUS les documents pdf que nous avons dans le répertoire sur lequel nous travaillons.

    En résumé, c'est un bon outil et comme il est écrit en logiciel libre, nous pouvons le modifier pour qu'il prenne en charge la langue espagnole, merci pour l'article!

  3.   Jimmy Olano dit

    LIRE CE DOCUMENT:

    https://pdfgrep.org/doc.html

    Je découvre et je vous fais savoir qu'il est proposé d'ajouter le paramètre «–unac» pour gérer les caractères accentués CEPENDANT, la version que j'ai téléchargée n'avait pas de support unac car elle n'était tout simplement pas compilée avec cet utilitaire, qu'ils appellent expérimental le chemin.
    Le plus drôle est que la commande grep n'a pas cette limitation, même en utilisant le paramètre -i avec grep, on peut rechercher "ú" et il retournera également "Ú".

    Dans tous les cas, je suis déjà en train de passer en revue le dépôt pdfgrep pour voir ce que j'apprends d'autre à ce sujet, d'accord je ne vous dérange plus (pour aujourd'hui).