Γίνετε επαγγελματίας pdf από το τερματικό του Ubuntu

Τερματικό με ενεργά χρώματα

Τα έγγραφα κειμένου είναι αρκετά κοινά έγγραφα μεταξύ των χρηστών Gnu / Linux και του κόσμου των υπολογιστών ... και μαζί του όλες οι εντολές και τα προγράμματα που σχετίζονται με αυτό. Αλλά σήμερα, τα αρχεία σε μορφή pdf κερδίζουν έδαφος πάνω από τα έγγραφα κειμένου, που είναι τα αγαπημένα για πολλούς χρήστες, προγραμματιστές και έργα.

Εάν χρησιμοποιούμε ένα γραφικό περιβάλλον, Η χρήση και η διαχείριση ενός αρχείου pdf είναι εύκοληΑλλά Τι γίνεται αν χρησιμοποιήσουμε το τερματικό; Στη συνέχεια θα σας πούμε πώς να χειριστείτε αρχεία pdf και να αναζητήσετε λέξεις, να μετρήσετε τους χαρακτήρες στο κείμενο του αρχείου pdf, κλπ ...

Γι 'αυτό θα κάνουμε χρήση της εντολής pdfgrep, μιας εντολής που είναι ένα πιρούνι της εντολής grep. Το Pdfgrep μας επιτρέπει να δημιουργήσουμε έγγραφα pdf, να στείλουμε πληροφορίες στο δημιουργημένο αρχείο ή απλά να αναζητήσουμε μια λέξη μέσα σε ένα έγγραφο pdf.

Το Pdfgrep είναι ένα εργαλείο που μπορούμε να βρούμε στα επίσημα αποθετήρια σχεδόν όλων των διανομών, επομένως, για την εγκατάστασή του, πρέπει να χρησιμοποιήσουμε μόνο τον διαχειριστή λογισμικού της διανομής και να το εγκαταστήσουμε. Ίσως συμβεί ότι η διανομή μας δεν την περιέχει, (κάτι περίεργο εάν χρησιμοποιούμε το Ubuntu). Σε αυτήν την περίπτωση πηγαίνουμε τον επίσημο ιστότοπο από τον προγραμματιστή και θα λάβουμε το πακέτο deb ή rpm για εγκατάσταση.

Μόλις το εγκαταστήσουμε, η λειτουργία πρέπει να έχει ως εξής:

pdfgrep [-v] pattern [archivo.pdf]

Σε αυτήν την περίπτωση, τόσο το pdfgrep όσο και το μοτίβο είναι σταθερές εντολές και [-v] είναι το μεταβλητό μέρος που θα χρησιμοποιήσουμε για την εκτέλεση λειτουργιών με αρχεία pdf, όπως αναζήτηση λέξεων, καταμέτρηση χαρακτήρων, κλπ ... Το [file.pdf] πρέπει να αλλάξει στο όνομα του αρχείου που θέλουμε να χρησιμοποιήσουμε ή να δημιουργήσουμε. Εάν βρίσκεται στον ίδιο φάκελο όπου βρισκόμαστε, δεν θα υπάρχει πρόβλημα, αλλά εάν το αρχείο pdf βρίσκεται σε άλλο μέρος του υπολογιστή, πρέπει να υποδείξουμε τη διεύθυνση του αρχείου pdf, γιατί διαφορετικά θα υπάρξει σφάλμα.

Εάν χρησιμοποιείτε πραγματικά την εντολή grep στο τερματικό, θα λατρέψετε την εντολή pdfgrep. Ένα εργαλείο που θα μας επιτρέψει δημιουργήστε αρχεία pdf με τις πληροφορίες της ομάδας μας και να μπορείτε να το στείλετε σε έναν φίλο, έναν τεχνικό ή οποιαδήποτε άλλη παρόμοια χρήση.


Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: Miguel Ángel Gatón
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.

  1.   Giovanni gapp dijo

    Συνεχίζουν να με βοηθούν με το σφάλμα BIOS που προκάλεσε το Ubuntu, κανονικά μας εγκαταλείπουν και προσποιούνται ότι μας ξεχνούν, έβλαψαν τον νέο μου υπολογιστή

    1.    Δόν Κιχώτης dijo

      Και ότι ίσως είσαι ηλίθιος, είσαι ένα κομμάτι που δεν καταλαβαίνεις ότι αυτό το ιστολόγιο δεν ανήκει σε κανονικό καταραμένο, κάθε φορά που βλέπω το blog που σχολιάζεις μαλακίες, σκατά κάπου αλλού

  2.   Τζίμι Όλανο dijo

    Μόλις εγκατέστησα την ακόλουθη έκδοση στο Ubuntu 16.04 μου:

    «Αυτή είναι η έκδοση 1.4.1 pdfgrep.

    Χρήση της έκδοσης poppler 0.41.0
    Χρήση της έκδοσης 8.41 2017-07-05 libpcre »

    Το κατάλαβα με την παράμετρο –V (ή –version) ΑΛΛΑ ΜΕ ΤΗΝ ΠΑΡΑΜΕΤΡΟ -v ΜΟΥ ΜΕΣΕΙ ΠΟΥ ΔΕΝ ΑΝΑΓΝΩΡΙΖΕΙ.

    Σε όλα αυτά θεωρώ ότι η εντολή -io –ignore-case είναι πιο χρήσιμη, η οποία επιστρέφει τη λέξη-κλειδί που μεταβιβάζουμε σε αυτήν στην αναζήτηση είτε σε κεφαλαία είτε σε πεζά.

    Ωστόσο, ΕΧΕΙ ΣΟΒΑΡΟ ΠΡΟΒΛΗΜΑ ΑΝΑΖΗΤΗΣΗ ΕΝΔΕΙΚΤΙΚΩΝ ΛΟΓΩΝ ΚΑΙ ΑΓΑΠΗ ΜΑΣ ΕΠΙΣΤΟΛΗ, εάν θέλουμε να αναζητήσουμε «παραγωγή» ή «προστασία», πρέπει να αναζητήσουμε:

    pdfgrep -i producc όνομα αρχείου.pdf
    pdfgrep -i προστασία filename.pdf

    (Προσπάθησα ήδη να το περικλείσω σε εισαγωγικά, μονό και διπλά, τον χαρακτήρα διαφυγής C γλώσσας "\" και χαρακτήρες μπαλαντέρ και τίποτα καθόλου). Για να αναζητήσω τη λέξη-κλειδί "έτος", η αλήθεια είναι ότι δεν μπορώ να σκεφτώ καμία εναλλακτική λύση, όποιος ξέρει κάτι παρακαλώ δημοσιεύστε εδώ και παρακαλώ απαντήστε μου.

    Η ΠΙΟ ΠΙΘΑΝΗ ΕΠΙΛΟΓΗ ΕΙΝΑΙ -ro-αναδρομική: αναζητά τη λέξη σε ΟΛΑ τα έγγραφα pdf που έχουμε στον κατάλογο στον οποίο εργαζόμαστε.

    Συνοπτικά, είναι ένα καλό εργαλείο και δεδομένου ότι είναι γραμμένο σε ελεύθερο λογισμικό, μπορούμε να το τροποποιήσουμε ώστε να υποστηρίζει την ισπανική γλώσσα, ευχαριστώ για το άρθρο!

  3.   Τζίμι Όλανο dijo

    ΔΙΑΒΑΣΤΕ ΤΟ ΕΓΓΡΑΦΟ:

    https://pdfgrep.org/doc.html

    Ανακαλύπτω και σας ενημερώνω ότι προτείνεται η προσθήκη της παραμέτρου «–unac» για τον χειρισμό των τονισμένων χαρακτήρων. Ωστόσο, η έκδοση που έχω κατεβάσει δεν είχε unac υποστήριξη, επειδή απλά δεν συντάχθηκε με αυτό το βοηθητικό πρόγραμμα, το οποίο αποκαλούν πειραματικό από ο ΤΡΟΠΟΣ.
    Το αστείο είναι ότι η εντολή grep δεν έχει αυτόν τον περιορισμό, ακόμη και όταν χρησιμοποιείτε την παράμετρο -i με grep μπορεί κανείς να αναζητήσει "ú" και θα επιστρέψει επίσης "Ú".

    Σε κάθε περίπτωση, εξετάζω ήδη το αποθετήριο pdfgrep για να δω τι άλλο μαθαίνω γι 'αυτό, αξίζει να μην σας ενοχλεί πια (για σήμερα).