Trở thành chuyên gia PDF từ thiết bị đầu cuối Ubuntu

Trở thành một chuyên gia pdf từ thiết bị đầu cuối Ubuntu

Tài liệu văn bản là tài liệu khá phổ biến giữa người dùng Gnu / Linux và thế giới máy tính ... và cùng với nó là tất cả các lệnh và chương trình liên quan đến nó. Nhưng ngày nay, các tệp ở định dạng pdf đang chiếm ưu thế hơn so với các tài liệu văn bản, trở thành mục yêu thích của nhiều người dùng, nhà phát triển và dự án.

Nếu chúng ta sử dụng môi trường đồ họa, sử dụng và quản lý tệp pdf thật dễ dàngnhưng Điều gì sẽ xảy ra nếu chúng ta sử dụng thiết bị đầu cuối? Tiếp theo, chúng tôi sẽ hướng dẫn bạn cách thao tác với tệp pdf và tìm kiếm từ, đếm các ký tự trong văn bản của tệp pdf, v.v.

Đối với điều này, chúng tôi sẽ làm sử dụng lệnh pdfgrep, một lệnh là nhánh rẽ của lệnh grep. Pdfgrep cho phép chúng tôi tạo tài liệu pdf, gửi thông tin đến tệp đã tạo hoặc đơn giản là tìm kiếm một từ trong tài liệu pdf.

Pdfgrep là một công cụ chúng ta có thể tìm thấy trong kho lưu trữ chính thức của hầu hết tất cả các bản phân phối, vì vậy để cài đặt nó, chúng tôi chỉ phải sử dụng trình quản lý phần mềm của bản phân phối và cài đặt nó. Có thể xảy ra trường hợp bản phân phối của chúng tôi không chứa nó, (điều lạ nếu chúng tôi sử dụng Ubuntu). Trong trường hợp đó, chúng tôi đi đến trang web chính thức từ nhà phát triển và chúng tôi sẽ tải gói deb hoặc rpm để cài đặt.

Sau khi chúng tôi đã cài đặt nó, hoạt động phải như sau:

pdfgrep [-v] pattern [archivo.pdf]

Trong trường hợp này, cả pdfgrep và pattern đều là các lệnh cố định và [-v] là phần biến mà chúng tôi sẽ sử dụng để thực hiện các thao tác với tệp pdf, chẳng hạn như tìm kiếm từ, đếm ký tự, v.v. ... [file.pdf] phải được thay đổi thành tên của tệp mà chúng tôi muốn sử dụng hoặc tạo. Nếu nó nằm trong cùng một thư mục với chúng tôi thì sẽ không có vấn đề gì, nhưng nếu tệp pdf nằm trong một phần khác của máy tính, chúng tôi phải chỉ ra địa chỉ của tệp pdf vì nếu không sẽ có lỗi.

Nếu bạn thực sự sử dụng lệnh grep trong thiết bị đầu cuối, bạn sẽ thích lệnh pdfgrep. Một công cụ sẽ cho phép chúng tôi tạo tệp pdf với thông tin của nhóm của chúng tôi và để có thể gửi nó cho bạn bè, kỹ thuật viên hoặc bất kỳ mục đích sử dụng tương tự nào khác.

Để lại bình luận của bạn Hủy trả lời

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

chú thích *

tên*

thư điện tử*

Tôi chấp nhận điều khoản riêng tư*

Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
Hợp pháp: Sự đồng ý của bạn
Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

Tôi muốn nhận bản tin

Giovanni gapp dijo
trước 6 năm

Họ tiếp tục giúp tôi với lỗi BIOS mà Ubuntu gây ra, canonical bỏ rơi chúng tôi và giả vờ quên chúng tôi, họ đã làm hỏng máy tính mới của tôi

Trả lời Giovanni Gapp
1. Don Quixote dijo
  trước 6 năm
  
  và rằng có lẽ bạn thật ngu ngốc, bạn troll mà bạn không hiểu rằng blog này không thuộc về kinh điển chết tiệt, mỗi lần tôi thấy blog bạn đang bình luận nhảm nhí đi đi nơi khác
  
  Trả lời donquijote
Jimmy olano dijo
trước 6 năm

Tôi vừa cài đặt phiên bản sau trên Ubuntu 16.04 của mình:

«Đây là pdfgrep phiên bản 1.4.1.

Sử dụng poppler phiên bản 0.41.0
Sử dụng phiên bản libpcre 8.41 2017-07-05 »

Tôi hiểu điều đó với tham số –V (hoặc –version) NHƯNG VỚI THAM SỐ -v NÓ NÓI VỚI TÔI RẰNG NÓ KHÔNG NHẬN ĐƯỢC.

Với tất cả những điều này, tôi thấy lệnh -io –ignore-case hữu ích hơn, nó trả về từ khóa mà chúng tôi chuyển cho nó khi tìm kiếm bằng chữ hoa hoặc chữ thường.

TUY NHIÊN, NÓ CÓ MỘT VẤN ĐỀ NGHIÊM TRỌNG ĐỂ TÌM KIẾM CÁC TỪ TẬP TRUNG VÀ THƯ GỬI TÌNH YÊU CỦA CHÚNG TÔI, nếu chúng tôi muốn tìm kiếm «sản xuất» hoặc «bảo vệ», chúng tôi phải tìm:

pdfgrep -i productionc file_name.pdf
pdfgrep -i bảo vệ filename.pdf

(Tôi đã thử đặt nó trong dấu ngoặc kép, đơn và kép, ký tự thoát ngôn ngữ C "\" và ký tự đại diện và không có gì cả). Để tìm kiếm từ khóa "năm", sự thật là mình không nghĩ ra cách nào khác thay thế được, bạn nào biết gì thì post lên đây mình giải đáp nhé.

LỰA CHỌN MẠNH MẼ NHẤT LÀ -ro –recursive: nó tìm kiếm từ trong TẤT CẢ các tài liệu pdf mà chúng tôi có trong thư mục mà chúng tôi đang làm việc.

Tóm lại, nó là một công cụ tốt và vì nó được viết bằng phần mềm miễn phí, chúng tôi có thể sửa đổi nó để nó hỗ trợ ngôn ngữ Tây Ban Nha, cảm ơn vì bài viết!

Trả lời Jimmy Olano
Jimmy olano dijo
trước 6 năm

ĐỌC TÀI LIỆU NÀY:

https://pdfgrep.org/doc.html

Tôi tìm hiểu và cho bạn biết rằng người ta đề xuất thêm tham số «–unac» để xử lý các ký tự có dấu TUY NHIÊN, phiên bản tôi đã tải xuống không có hỗ trợ unac vì đơn giản là nó không được biên dịch với tiện ích đó, mà họ gọi là thử nghiệm bởi cách.
Điều buồn cười là lệnh grep không có giới hạn đó, thậm chí khi sử dụng tham số -i với grep người ta có thể tìm kiếm "ú" và nó cũng sẽ trả về "Ú".

Trong mọi trường hợp, tôi đang xem xét kho lưu trữ pdfgrep để xem tôi học được gì khác về nó, điều đó đáng để không làm phiền bạn nữa (cho ngày hôm nay).

Trả lời Jimmy Olano