Torne-se um profissional de PDF no terminal Ubuntu

Torne-se um PDF profissional a partir do terminal Ubuntu

Documentos de texto são documentos bastante comuns entre usuários Gnu / Linux e o mundo da informática ... e com eles todos os comandos e programas relacionados a eles. Mas hoje em dia, os arquivos em formato pdf estão ganhando espaço em relação aos documentos de texto, sendo os favoritos de muitos usuários, desenvolvedores e projetos.

Se usarmos um ambiente gráfico, usar e gerenciar um arquivo pdf é fácilMas E se usarmos o terminal? A seguir, explicamos como manipular arquivos PDF e pesquisar palavras, contar os caracteres no texto do arquivo PDF, etc ...

Para isso vamos fazer uso do comando pdfgrep, um comando que é um fork do comando grep. Pdfgrep nos permite criar documentos PDF, enviar informações para o arquivo criado ou simplesmente pesquisar uma palavra dentro de um documento PDF.

Pdfgrep é uma ferramenta que podemos encontrar nos repositórios oficiais de quase todas as distribuições, portanto para a sua instalação só temos que utilizar o gestor de software da distribuição e instalá-lo. Pode acontecer que a nossa distribuição não o contenha, (algo estranho se usarmos o Ubuntu). Nesse caso, vamos para o site oficial do desenvolvedor e obteremos o pacote deb ou rpm para instalar.

Depois de instalado, o funcionamento deve ser o seguinte:

pdfgrep [-v] pattern [archivo.pdf]

Neste caso, pdfgrep e pattern são comandos fixos e [-v] é a parte variável que usaremos para realizar operações com arquivos PDF, como pesquisar palavras, contar caracteres, etc ... O [arquivo.pdf] deve ser alterado para o nome do arquivo que queremos usar ou criar. Se estiver na mesma pasta em que estamos, não haverá problema, mas se o arquivo pdf estiver em outra parte do computador, devemos indicar o endereço do arquivo pdf, caso contrário haverá um erro.

Se você realmente usa o comando grep no terminal, vai adorar o comando pdfgrep. Uma ferramenta que nos permitirá gerar arquivos pdf com as informações de nossa equipe e poder enviá-lo a um amigo, técnico ou qualquer outro uso semelhante.

Deixe um comentário Cancelar resposta

Giovanni gapp dito
atrás Anos 6

Eles continuam a me ajudar com o erro de BIOS que o Ubuntu causou, nos abandonam canônicos e fingem nos esquecer, eles danificaram meu novo computador

Resposta a Giovanni Gapp
1. Don Quixote dito
  atrás Anos 6
  
  e que talvez você seja estúpido, seu troll que você não entende que esse blog não pertence a droga canônica subnormal, toda vez que eu vejo o blog você está comentando besteira vai merda em outro lugar
  
  Responder a donquixote
Jimmy olano dito
atrás Anos 6

Acabei de instalar a seguinte versão no meu Ubuntu 16.04:

«Esta é a versão 1.4.1 do pdfgrep.

Usando poppler versão 0.41.0
Usando libpcre versão 8.41-2017-07-05 »

Consegui isso com o parâmetro –V (ou –version), MAS COM O PARÂMETRO -v ME DIZ QUE NÃO O RECONHECE.

Para todos esses, acho mais útil o comando -io –ignore-case, que retorna em maiúsculas ou minúsculas a palavra-chave que lhe passamos em sua pesquisa.

NO ENTANTO, TEM UM SÉRIO PROBLEMA PARA BUSCAR PALAVRAS ACENTUADAS E NOSSA CARA EÑE, se queremos buscar «produção» ou «proteção» devemos buscar:

pdfgrep -i producc file_name.pdf
pdfgrep -i protect filename.pdf

(Eu já tentei colocá-lo entre aspas, simples e duplas, o caractere de escape da linguagem C "\" e caracteres curinga e nada). Para pesquisar a palavra-chave “ano”, a verdade é que não consigo pensar em alternativa, quem souber de alguma coisa poste aqui e responda.

A OPÇÃO MAIS PODEROSA É -ro -recursiva: procura a palavra em TODOS os documentos pdf que temos no diretório em que estamos trabalhando.

Resumindo, é uma boa ferramenta e como está escrita em software livre podemos modificá-la para que suporte a língua espanhola, obrigado pelo artigo!

Resposta a Jimmy Olano
Jimmy olano dito
atrás Anos 6

LENDO ESTE DOCUMENTO:

https://pdfgrep.org/doc.html

Eu descobri e informo que é proposto adicionar o parâmetro «–unac» para lidar com os caracteres acentuados NO ENTANTO, a versão que baixei não tinha suporte a unac porque simplesmente não foi compilada com aquele utilitário, que eles chamam de experimental por o caminho.
O engraçado é que o comando grep não tem essa limitação, mesmo ao usar o parâmetro -i com grep pode-se pesquisar por "ú" e também retornará "Ú".

Em qualquer caso, já estou revisando o repositório pdfgrep para ver o que mais eu aprendi sobre ele, ok, eu não incomodo mais (por hoje).

Resposta a Jimmy Olano