Ubuntu 터미널에서 PDF 전문가 되기

Ubuntu 터미널에서 PDF 전문가되기

텍스트 문서는 Gnu / Linux 사용자와 컴퓨터 세계 사이에서 매우 일반적인 문서입니다. ... 그리고 그와 관련된 모든 명령과 프로그램이 있습니다. 그러나 요즘에는 pdf 형식의 파일이 텍스트 문서보다 더 많이 사용되고 있으며 많은 사용자, 개발자 및 프로젝트에서 선호하는 제품입니다.

그래픽 환경을 사용하는 경우 pdf 파일 사용 및 관리가 쉽습니다., 그러나 터미널을 사용하면 어떨까요? 다음으로 pdf 파일을 조작하고 단어를 검색하고 pdf 파일의 텍스트에서 문자를 계산하는 방법 등을 알려드립니다.

이를 위해 우리는 할 것입니다 grep 명령의 포크 인 명령 인 pdfgrep 명령 사용. Pdfgrep을 사용하면 pdf 문서를 생성하거나 생성 된 파일에 정보를 전송하거나 pdf 문서 내에서 단어를 검색 할 수 있습니다.

Pdfgrep은 거의 모든 배포판의 공식 저장소에서 찾을 수 있습니다., 따라서 설치를 위해 배포판의 소프트웨어 관리자를 사용하여 설치하면됩니다. 배포판에 포함되어 있지 않을 수 있습니다 (Ubuntu를 사용하는 경우 이상 함). 이 경우 우리는 공식 웹 사이트 개발자로부터 deb 또는 rpm 패키지를 받아 설치할 것입니다.

설치가 완료되면 작업은 다음과 같아야합니다.

pdfgrep [-v] pattern [archivo.pdf]

이 경우 pdfgrep과 pattern은 모두 고정 된 명령이며 [-v]는 pdf 파일로 작업을 수행하는 데 사용할 변수 부분입니다., 단어 검색, 문자 세기 등 ... [file.pdf]는 사용하거나 만들려는 파일의 이름으로 변경해야합니다. 우리와 같은 폴더에 있으면 문제가 없지만 pdf 파일이 컴퓨터의 다른 부분에 있으면 pdf 파일의 주소를 표시해야합니다. 그렇지 않으면 오류가 발생하기 때문입니다.

터미널에서 grep 명령을 실제로 사용한다면 pdfgrep 명령을 좋아할 것입니다. 우리를 허용하는 도구 우리 팀의 정보로 pdf 파일 생성 친구, 기술자 또는 기타 유사한 용도로 보낼 수 있습니다.

코멘트를 남겨주세요 답장 취소

조반니 갭 말
전 6 년

그들은 우분투로 인한 BIOS 오류로 나를 계속 돕고 정식으로 우리를 버리고 우리를 잊은 척하고 새 컴퓨터를 손상시킵니다.

Giovanni Gapp에게 답장
1. 돈 키호테 말
  전 6 년
  
  그리고 아마도 당신은 어리석은 트롤의 일부입니다.이 블로그가 정규적인 망할 비정상적인 것에 속하지 않는다는 것을 이해하지 못하는 트롤 조각입니다.
  
  donquijote에게 답장
지미 올라 노 말
전 6 년

방금 Ubuntu 16.04에 다음 버전을 설치했습니다.

«이것은 pdfgrep 버전 1.4.1입니다.

Poppler 버전 0.41.0 사용
libpcre 버전 8.41 사용 2017-07-05»

–V (또는 –version) 매개 변수를 사용했지만 -v 매개 변수를 사용하면 인식하지 못한다는 메시지가 표시됩니다.

이 모든 것에 대해 -io –ignore-case 명령이 더 유용하다는 것을 알았습니다. 검색에서 전달한 키워드를 대문자 또는 소문자로 반환합니다.

그러나 악센트 단어와 친애하는 EÑE 편지를 검색하는 데 심각한 문제가 있습니다.«production»또는«protection»을 검색하려면 다음을 찾아야합니다.

pdfgrep -i producc file_name.pdf
pdfgrep -i 파일명 .pdf 보호

(이미 따옴표, 단일 및 이중, C 언어 이스케이프 문자 "\"및 와일드 카드 문자로 묶어 보았습니다.) 키워드 "연도"를 검색하려면 어떤 대안도 생각할 수 없습니다. 아는 사람은 여기에 게시하고 답해주세요.

가장 강력한 옵션은 -ro –recursive입니다. 작업중인 디렉토리에있는 모든 pdf 문서에서 단어를 찾습니다.

요약하면 좋은 도구이며 무료 소프트웨어로 작성되었으므로 스페인어를 지원하도록 수정할 수 있습니다. 기사 감사합니다!

지미 올라 노에게 답장
지미 올라 노 말
전 6 년

이 문서 읽기 :

https://pdfgrep.org/doc.html

악센트 부호가있는 문자를 처리하기 위해«–unac»매개 변수를 추가하는 것이 제안되었음을 알게되었습니다. 그러나 다운로드 한 버전은 단순히 해당 유틸리티로 컴파일되지 않았기 때문에 unac 지원이 없었습니다. 방법.
재미있는 점은 grep 명령에 이러한 제한이 없다는 것입니다. grep과 함께 -i 매개 변수를 사용하는 경우에도 "ú"를 검색 할 수 있고 "Ú"도 반환합니다.

어쨌든 나는 이미 pdfgrep 저장소를 검토하여 그것에 대해 다른 것을 배우고 있습니다. 더 이상 (오늘은) 당신을 괴롭히지 않을 가치가 있습니다.

지미 올라 노에게 답장