มาเป็นมืออาชีพด้าน pdf จากเทอร์มินัล Ubuntu

ขั้วที่มีสีที่ใช้งานอยู่

เอกสารข้อความเป็นเอกสารทั่วไปในหมู่ผู้ใช้ Gnu / Linux และโลกคอมพิวเตอร์ ... และด้วยคำสั่งและโปรแกรมทั้งหมดที่เกี่ยวข้อง แต่ปัจจุบันไฟล์ในรูปแบบ pdf ได้รับความนิยมมากกว่าเอกสารข้อความซึ่งเป็นรายการโปรดสำหรับผู้ใช้นักพัฒนาและโครงการจำนวนมาก

หากเราใช้สภาพแวดล้อมแบบกราฟิก การใช้และจัดการไฟล์ pdf เป็นเรื่องง่ายแต่ ถ้าเราใช้เทอร์มินัลล่ะ? ต่อไปเราจะบอกวิธีจัดการไฟล์ pdf และค้นหาคำนับตัวอักษรในข้อความของไฟล์ pdf ฯลฯ ...

สำหรับสิ่งนี้เราจะทำ การใช้คำสั่ง pdfgrep คำสั่งที่เป็น fork ของคำสั่ง grep. Pdfgrep ช่วยให้เราสามารถสร้างเอกสาร pdf ส่งข้อมูลไปยังไฟล์ที่สร้างขึ้นหรือเพียงแค่ค้นหาคำภายในเอกสาร pdf

Pdfgrep เป็นเครื่องมือที่ เราสามารถพบได้ในที่เก็บอย่างเป็นทางการของการแจกแจงเกือบทั้งหมดดังนั้นสำหรับการติดตั้งเราต้องใช้ตัวจัดการซอฟต์แวร์ของการแจกจ่ายและติดตั้งเท่านั้น อาจเกิดขึ้นได้ว่าการแจกจ่ายของเราไม่มีมัน (มีบางอย่างที่แปลกถ้าเราใช้ Ubuntu) ในกรณีนี้เราไปที่ เว็บไซต์อย่างเป็นทางการ จากผู้พัฒนาและเราจะได้รับแพคเกจ deb หรือ rpm เพื่อติดตั้ง

เมื่อเราติดตั้งแล้วการดำเนินการจะต้องเป็นดังนี้:

pdfgrep [-v] pattern [archivo.pdf]

ในกรณีนี้ทั้ง pdfgrep และ pattern เป็นคำสั่งคงที่และ [-v] เป็นส่วนตัวแปรที่เราจะใช้ในการดำเนินการกับไฟล์ pdfเช่นการค้นหาคำการนับอักขระ ฯลฯ ... [file.pdf] จะต้องเปลี่ยนเป็นชื่อไฟล์ที่เราต้องการใช้หรือสร้าง หากอยู่ในโฟลเดอร์เดียวกันกับที่เราอยู่จะไม่มีปัญหา แต่ถ้าไฟล์ pdf อยู่ในส่วนอื่นของคอมพิวเตอร์เราจะต้องระบุที่อยู่ของไฟล์ pdf ไม่เช่นนั้นจะมีข้อผิดพลาด

หากคุณใช้คำสั่ง grep ในเทอร์มินัลจริงๆคุณจะชอบคำสั่ง pdfgrep เครื่องมือที่จะช่วยให้เรา สร้างไฟล์ pdf ด้วยข้อมูลของทีมงานของเรา และสามารถส่งไปให้เพื่อนช่างเทคนิคหรือการใช้งานอื่น ๆ ที่คล้ายคลึงกันได้


แสดงความคิดเห็นของคุณ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

*

*

  1. ผู้รับผิดชอบข้อมูล: Miguel ÁngelGatón
  2. วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
  3. ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
  4. การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
  5. การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
  6. สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา

  1.   Giovanni gapp dijo

    พวกเขายังคงช่วยฉันเกี่ยวกับข้อผิดพลาด BIOS ที่ Ubuntu ทำให้เกิดขึ้นโดยยอมรับได้ละทิ้งเราและแกล้งทำเป็นลืมเราพวกเขาทำให้คอมพิวเตอร์เครื่องใหม่ของฉันเสียหาย

    1.    ดอนกิโฆเต้ dijo

      และบางทีคุณอาจจะโง่คุณก็เป็นเรื่องตลกที่คุณไม่เข้าใจว่าบล็อกนี้ไม่ได้เป็นของผิดปกติทั่วไปทุกครั้งที่ฉันเห็นบล็อกที่คุณแสดงความคิดเห็นพล่ามไปอึที่อื่น

  2.   จิมมี่โอลาโน dijo

    ฉันเพิ่งติดตั้งเวอร์ชันต่อไปนี้บน Ubuntu 16.04 ของฉัน:

    «นี่คือ pdfgrep เวอร์ชัน 1.4.1

    ใช้ poppler เวอร์ชัน 0.41.0
    ใช้ libpcre เวอร์ชัน 8.41 2017-07-05 »

    ฉันเข้าใจแล้วด้วยพารามิเตอร์ –V (หรือ –version) แต่ด้วยพารามิเตอร์ -v มันบอกฉันว่ามันไม่รู้จักมัน

    สำหรับสิ่งเหล่านี้ฉันพบว่าคำสั่ง -io –ignore-case มีประโยชน์มากกว่าซึ่งจะส่งคืนคำหลักเป็นตัวพิมพ์ใหญ่หรือตัวพิมพ์เล็กที่เราส่งไปให้ในการค้นหา

    อย่างไรก็ตามมันมีปัญหาร้ายแรงในการค้นหาคำที่เน้นและจดหมายเรียนรู้ของเราหากเราต้องการค้นหา«การผลิต»หรือ«การป้องกัน»เราต้องมองหา:

    pdfgrep -i Producc file_name.pdf
    pdfgrep -i ป้องกัน filename.pdf

    (ฉันได้ลองใส่ไว้ในเครื่องหมายคำพูดเดี่ยวและคู่อักขระหนีภาษา C "\" และอักขระตัวแทนและไม่มีอะไรเลย) ในการค้นหาคีย์เวิร์ด "ปี" ความจริงก็คือฉันคิดไม่ออกว่าจะหาทางเลือกอื่นใครพอจะรู้บ้างโปรดโพสต์ที่นี่และช่วยตอบฉันด้วย

    ตัวเลือกที่ทรงพลังที่สุดคือ -ro -recursive: ค้นหาคำในเอกสาร pdf ทั้งหมดที่เรามีในไดเร็กทอรีที่เรากำลังดำเนินการอยู่

    โดยสรุปแล้วมันเป็นเครื่องมือที่ดีและเนื่องจากมันถูกเขียนด้วยซอฟต์แวร์ฟรีเราจึงสามารถแก้ไขเพื่อให้รองรับภาษาสเปนได้ขอบคุณสำหรับบทความ!

  3.   จิมมี่โอลาโน dijo

    การอ่านเอกสารนี้:

    https://pdfgrep.org/doc.html

    ฉันพบและแจ้งให้คุณทราบว่ามีการเสนอให้เพิ่มพารามิเตอร์« –unac »เพื่อจัดการกับอักขระเน้นเสียงอย่างไรก็ตามเวอร์ชันที่ฉันดาวน์โหลดไม่มีการรองรับ unac เนื่องจากไม่ได้รวบรวมด้วยยูทิลิตี้นั้นเพียงอย่างเดียวซึ่งพวกเขาเรียกว่าการทดลองโดย ทาง.
    สิ่งที่น่าตลกคือคำสั่ง grep ไม่มีข้อ จำกัด นั้นแม้ว่าจะใช้พารามิเตอร์ -i กับ grep ก็สามารถค้นหา "ú" ได้และจะส่งคืน "Ú" ด้วย

    ไม่ว่าในกรณีใดฉันกำลังตรวจสอบที่เก็บ pdfgrep อยู่แล้วเพื่อดูว่ามีอะไรอีกบ้างที่ฉันได้เรียนรู้เกี่ยวกับเรื่องนี้โอเคฉันจะไม่รบกวนคุณอีกต่อไป (สำหรับวันนี้)