Jadilah profesional pdf dari terminal Ubuntu

Terminal dengan warna aktif

Dokumen teks adalah dokumen yang sangat biasa di kalangan pengguna Gnu / Linux dan dunia komputer ... dan dengan itu semua arahan dan program yang berkaitan dengannya. Tetapi pada masa ini, fail dalam format pdf semakin mendapat tempat di atas dokumen teks, menjadi kegemaran banyak pengguna, pembangun dan projek.

Sekiranya kita menggunakan persekitaran grafik, menggunakan dan menguruskan fail pdf adalah mudah, tetapi Bagaimana jika kita menggunakan terminal? Seterusnya kami memberitahu anda cara memanipulasi fail pdf dan mencari kata, menghitung watak dalam teks fail pdf, dll ...

Untuk ini kita akan lakukan penggunaan perintah pdfgrep, arahan yang merupakan garpu perintah grep. Pdfgrep membolehkan kita membuat dokumen pdf, menghantar maklumat ke fail yang dibuat atau hanya mencari perkataan dalam dokumen pdf.

Pdfgrep adalah alat yang kita dapat mencari di repositori rasmi hampir semua pengedaran, jadi untuk pemasangannya kita hanya perlu menggunakan pengurus perisian pengedaran dan memasangnya. Mungkin berlaku bahawa pengedaran kami tidak mengandungnya, (sesuatu yang pelik jika kami menggunakan Ubuntu). Sekiranya kita pergi ke laman web rasmi dari pemaju dan kami akan memasang pakej deb atau rpm untuk dipasang.

Setelah kami memasangnya, operasi mestilah seperti berikut:

pdfgrep [-v] pattern [archivo.pdf]

Dalam kes ini, kedua-dua pdfgrep dan corak adalah perintah tetap dan [-v] adalah bahagian pemboleh ubah yang akan kita gunakan untuk menjalankan operasi dengan fail pdf, seperti mencari kata, menghitung watak, dll ... [file.pdf] harus diubah menjadi nama fail yang ingin kita gunakan atau buat. Sekiranya ia berada di folder yang sama di mana kita berada, tidak akan ada masalah, tetapi jika fail pdf berada di bahagian lain komputer, kita mesti menunjukkan alamat fail pdf kerana jika tidak, akan ada ralat.

Sekiranya anda benar-benar menggunakan perintah grep di terminal, anda akan menyukai perintah pdfgrep. Alat yang akan membolehkan kita menghasilkan fail pdf dengan maklumat pasukan kami dan dapat menghantarnya kepada rakan, juruteknik atau penggunaan lain yang serupa.


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab atas data: Miguel Ángel Gatón
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.

  1.   Giovanni gapp kata

    Mereka terus menolong saya dengan ralat BIOS yang disebabkan oleh Ubuntu, kanonik meninggalkan kita dan berpura-pura melupakan kita, mereka merosakkan komputer baru saya

    1.    Don Quixote kata

      Dan itu mungkin anda bodoh, anda tidak tahu bahawa blog ini bukan milik kanonikal sialan normal, setiap kali saya melihat blog anda komen omong kosong omong kosong di tempat lain

  2.   Jimmy olano kata

    Saya baru sahaja memasang versi berikut pada Ubuntu 16.04 saya:

    «Ini adalah versi pdfgrep 1.4.1.

    Menggunakan poppler versi 0.41.0
    Menggunakan libpcre versi 8.41 2017-07-05 »

    Saya mengetahuinya dengan parameter –V (atau –version) TETAPI DENGAN PARAMETER -V ITU MENGATAKAN SAYA YANG TIDAK MENGAKUI.

    Untuk semua ini saya dapati perintah -io –ignore-case menjadi lebih berguna, yang mengembalikan sama ada dengan huruf besar atau huruf kecil yang kami sampaikan dalam cariannya.

    Walau bagaimanapun, ia mempunyai masalah yang serius untuk mencari kata-kata yang diakui dan surat-surat yang kita terima, jika kita ingin mencari "produksi" atau "perlindungan" kita mesti mencari:

    pdfgrep -i nama fail producc.pdf
    pdfgrep -i melindungi nama fail.pdf

    (Saya sudah cuba melampirkannya dalam tanda kutip, tunggal dan dua, watak pelarian bahasa C "\" dan watak wildcard dan sama sekali). Untuk mencari kata kunci "tahun", sebenarnya saya tidak dapat memikirkan alternatif lain, sesiapa yang mengetahui sesuatu sila hantarkan di sini dan jawab saya.

    PILIHAN PALING KUAT ADALAH -ro –recursive: ia mencari perkataan di SEMUA dokumen pdf yang ada di dalam direktori yang sedang kita jalankan.

    Ringkasnya, ini adalah alat yang baik dan kerana ia ditulis dalam perisian percuma, kami dapat mengubahnya sehingga menyokong bahasa Sepanyol, terima kasih untuk artikelnya!

  3.   Jimmy olano kata

    MEMBACA DOKUMEN INI:

    https://pdfgrep.org/doc.html

    Saya mengetahuinya dan memberitahu anda bahawa dicadangkan untuk menambahkan parameter «–unac» untuk menangani watak beraksen TETAPI, versi yang saya muat turun tidak mempunyai sokongan unac kerana ia tidak disusun dengan utiliti itu, yang mereka namakan eksperimen oleh Jalan.
    Yang melucukan adalah bahawa perintah grep tidak mempunyai batasan itu, walaupun ketika menggunakan parameter -i dengan grep seseorang dapat mencari "ú" dan ia juga akan mengembalikan "Ú".

    Walau apa pun, saya sudah menyemak repositori pdfgrep untuk melihat apa lagi yang saya pelajari mengenainya, tidak perlu mengganggu anda lagi (untuk hari ini).