เป็นมืออาชีพ PDF จากเทอร์มินัล Ubuntu

มาเป็นมืออาชีพด้าน pdf จากเทอร์มินัล Ubuntu

เอกสารข้อความเป็นเอกสารทั่วไปในหมู่ผู้ใช้ Gnu / Linux และโลกคอมพิวเตอร์ ... และด้วยคำสั่งและโปรแกรมทั้งหมดที่เกี่ยวข้อง แต่ปัจจุบันไฟล์ในรูปแบบ pdf ได้รับความนิยมมากกว่าเอกสารข้อความซึ่งเป็นรายการโปรดสำหรับผู้ใช้นักพัฒนาและโครงการจำนวนมาก

หากเราใช้สภาพแวดล้อมแบบกราฟิก การใช้และจัดการไฟล์ pdf เป็นเรื่องง่ายแต่ ถ้าเราใช้เทอร์มินัลล่ะ? ต่อไปเราจะบอกวิธีจัดการไฟล์ pdf และค้นหาคำนับตัวอักษรในข้อความของไฟล์ pdf ฯลฯ ...

สำหรับสิ่งนี้เราจะทำ การใช้คำสั่ง pdfgrep คำสั่งที่เป็น fork ของคำสั่ง grep. Pdfgrep ช่วยให้เราสามารถสร้างเอกสาร pdf ส่งข้อมูลไปยังไฟล์ที่สร้างขึ้นหรือเพียงแค่ค้นหาคำภายในเอกสาร pdf

Pdfgrep เป็นเครื่องมือที่ เราสามารถพบได้ในที่เก็บอย่างเป็นทางการของการแจกแจงเกือบทั้งหมดดังนั้นสำหรับการติดตั้งเราต้องใช้ตัวจัดการซอฟต์แวร์ของการแจกจ่ายและติดตั้งเท่านั้น อาจเกิดขึ้นได้ว่าการแจกจ่ายของเราไม่มีมัน (มีบางอย่างที่แปลกถ้าเราใช้ Ubuntu) ในกรณีนี้เราไปที่ เว็บไซต์อย่างเป็นทางการ จากผู้พัฒนาและเราจะได้รับแพคเกจ deb หรือ rpm เพื่อติดตั้ง

เมื่อเราติดตั้งแล้วการดำเนินการจะต้องเป็นดังนี้:

pdfgrep [-v] pattern [archivo.pdf]

ในกรณีนี้ทั้ง pdfgrep และ pattern เป็นคำสั่งคงที่และ [-v] เป็นส่วนตัวแปรที่เราจะใช้ในการดำเนินการกับไฟล์ pdfเช่นการค้นหาคำการนับอักขระ ฯลฯ ... [file.pdf] จะต้องเปลี่ยนเป็นชื่อไฟล์ที่เราต้องการใช้หรือสร้าง หากอยู่ในโฟลเดอร์เดียวกันกับที่เราอยู่จะไม่มีปัญหา แต่ถ้าไฟล์ pdf อยู่ในส่วนอื่นของคอมพิวเตอร์เราจะต้องระบุที่อยู่ของไฟล์ pdf ไม่เช่นนั้นจะมีข้อผิดพลาด

หากคุณใช้คำสั่ง grep ในเทอร์มินัลจริงๆคุณจะชอบคำสั่ง pdfgrep เครื่องมือที่จะช่วยให้เรา สร้างไฟล์ pdf ด้วยข้อมูลของทีมงานของเรา และสามารถส่งไปให้เพื่อนช่างเทคนิคหรือการใช้งานอื่น ๆ ที่คล้ายคลึงกันได้

แสดงความคิดเห็นของคุณ ยกเลิกการตอบ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

คิดเห็น *

ชื่อ*

จดหมายอิเล็กทรอนิกส์*

ฉันยอมรับ ข้อกำหนดความเป็นส่วนตัว*

ผู้รับผิดชอบข้อมูล: Miguel ÁngelGatón
วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา

ฉันต้องการรับจดหมายข่าว

Giovanni gapp dijo
มาแล้ว ปี 6

พวกเขายังคงช่วยฉันเกี่ยวกับข้อผิดพลาด BIOS ที่ Ubuntu ทำให้เกิดขึ้นโดยยอมรับได้ละทิ้งเราและแกล้งทำเป็นลืมเราพวกเขาทำให้คอมพิวเตอร์เครื่องใหม่ของฉันเสียหาย

ตอบกลับ Giovanni Gapp
1. ดอนกิโฆเต้ dijo
  มาแล้ว ปี 6
  
  และบางทีคุณอาจจะโง่คุณก็เป็นเรื่องตลกที่คุณไม่เข้าใจว่าบล็อกนี้ไม่ได้เป็นของผิดปกติทั่วไปทุกครั้งที่ฉันเห็นบล็อกที่คุณแสดงความคิดเห็นพล่ามไปอึที่อื่น
  
  ตอบกลับ donquijote
จิมมี่โอลาโน dijo
มาแล้ว ปี 6

ฉันเพิ่งติดตั้งเวอร์ชันต่อไปนี้บน Ubuntu 16.04 ของฉัน:

«นี่คือ pdfgrep เวอร์ชัน 1.4.1

ใช้ poppler เวอร์ชัน 0.41.0
ใช้ libpcre เวอร์ชัน 8.41 2017-07-05 »

ฉันเข้าใจแล้วด้วยพารามิเตอร์ –V (หรือ –version) แต่ด้วยพารามิเตอร์ -v มันบอกฉันว่ามันไม่รู้จักมัน

สำหรับสิ่งเหล่านี้ฉันพบว่าคำสั่ง -io –ignore-case มีประโยชน์มากกว่าซึ่งจะส่งคืนคำหลักเป็นตัวพิมพ์ใหญ่หรือตัวพิมพ์เล็กที่เราส่งไปให้ในการค้นหา

อย่างไรก็ตามมันมีปัญหาร้ายแรงในการค้นหาคำที่เน้นและจดหมายเรียนรู้ของเราหากเราต้องการค้นหา«การผลิต»หรือ«การป้องกัน»เราต้องมองหา:

pdfgrep -i Producc file_name.pdf
pdfgrep -i ป้องกัน filename.pdf

(ฉันได้ลองใส่ไว้ในเครื่องหมายคำพูดเดี่ยวและคู่อักขระหนีภาษา C "\" และอักขระตัวแทนและไม่มีอะไรเลย) ในการค้นหาคีย์เวิร์ด "ปี" ความจริงก็คือฉันคิดไม่ออกว่าจะหาทางเลือกอื่นใครพอจะรู้บ้างโปรดโพสต์ที่นี่และช่วยตอบฉันด้วย

ตัวเลือกที่ทรงพลังที่สุดคือ -ro -recursive: ค้นหาคำในเอกสาร pdf ทั้งหมดที่เรามีในไดเร็กทอรีที่เรากำลังดำเนินการอยู่

โดยสรุปแล้วมันเป็นเครื่องมือที่ดีและเนื่องจากมันถูกเขียนด้วยซอฟต์แวร์ฟรีเราจึงสามารถแก้ไขเพื่อให้รองรับภาษาสเปนได้ขอบคุณสำหรับบทความ!

ตอบกลับ Jimmy Olano
จิมมี่โอลาโน dijo
มาแล้ว ปี 6

การอ่านเอกสารนี้:

https://pdfgrep.org/doc.html

ฉันพบและแจ้งให้คุณทราบว่ามีการเสนอให้เพิ่มพารามิเตอร์« –unac »เพื่อจัดการกับอักขระเน้นเสียงอย่างไรก็ตามเวอร์ชันที่ฉันดาวน์โหลดไม่มีการรองรับ unac เนื่องจากไม่ได้รวบรวมด้วยยูทิลิตี้นั้นเพียงอย่างเดียวซึ่งพวกเขาเรียกว่าการทดลองโดย ทาง.
สิ่งที่น่าตลกคือคำสั่ง grep ไม่มีข้อ จำกัด นั้นแม้ว่าจะใช้พารามิเตอร์ -i กับ grep ก็สามารถค้นหา "ú" ได้และจะส่งคืน "Ú" ด้วย

ไม่ว่าในกรณีใดฉันกำลังตรวจสอบที่เก็บ pdfgrep อยู่แล้วเพื่อดูว่ามีอะไรอีกบ้างที่ฉันได้เรียนรู้เกี่ยวกับเรื่องนี้โอเคฉันจะไม่รบกวนคุณอีกต่อไป (สำหรับวันนี้)

ตอบกลับ Jimmy Olano