Torne-se um PDF profissional a partir do terminal Ubuntu

Terminal com cores ativas

Documentos de texto são documentos bastante comuns entre usuários Gnu / Linux e o mundo da informática ... e com eles todos os comandos e programas relacionados a eles. Mas hoje em dia, os arquivos em formato pdf estão ganhando espaço em relação aos documentos de texto, sendo os favoritos de muitos usuários, desenvolvedores e projetos.

Se usarmos um ambiente gráfico, usar e gerenciar um arquivo pdf é fácilMas E se usarmos o terminal? A seguir, explicamos como manipular arquivos PDF e pesquisar palavras, contar os caracteres no texto do arquivo PDF, etc ...

Para isso vamos fazer uso do comando pdfgrep, um comando que é um fork do comando grep. Pdfgrep nos permite criar documentos PDF, enviar informações para o arquivo criado ou simplesmente pesquisar uma palavra dentro de um documento PDF.

Pdfgrep é uma ferramenta que podemos encontrar nos repositórios oficiais de quase todas as distribuições, portanto para a sua instalação só temos que utilizar o gestor de software da distribuição e instalá-lo. Pode acontecer que a nossa distribuição não o contenha, (algo estranho se usarmos o Ubuntu). Nesse caso, vamos para o site oficial do desenvolvedor e obteremos o pacote deb ou rpm para instalar.

Depois de instalado, o funcionamento deve ser o seguinte:

pdfgrep [-v] pattern [archivo.pdf]

Neste caso, pdfgrep e pattern são comandos fixos e [-v] é a parte variável que usaremos para realizar operações com arquivos PDF, como pesquisar palavras, contar caracteres, etc ... O [arquivo.pdf] deve ser alterado para o nome do arquivo que queremos usar ou criar. Se estiver na mesma pasta em que estamos, não haverá problema, mas se o arquivo pdf estiver em outra parte do computador, devemos indicar o endereço do arquivo pdf, caso contrário haverá um erro.

Se você realmente usa o comando grep no terminal, vai adorar o comando pdfgrep. Uma ferramenta que nos permitirá gerar arquivos pdf com as informações de nossa equipe e poder enviá-lo a um amigo, técnico ou qualquer outro uso semelhante.


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: Miguel Ángel Gatón
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.

  1.   Giovanni gapp dito

    Eles continuam a me ajudar com o erro de BIOS que o Ubuntu causou, nos abandonam canônicos e fingem nos esquecer, eles danificaram meu novo computador

    1.    Don Quixote dito

      e que talvez você seja estúpido, seu troll que você não entende que esse blog não pertence a droga canônica subnormal, toda vez que eu vejo o blog você está comentando besteira vai merda em outro lugar

  2.   Jimmy olano dito

    Acabei de instalar a seguinte versão no meu Ubuntu 16.04:

    «Esta é a versão 1.4.1 do pdfgrep.

    Usando poppler versão 0.41.0
    Usando libpcre versão 8.41-2017-07-05 »

    Consegui isso com o parâmetro –V (ou –version), MAS COM O PARÂMETRO -v ME ​​DIZ QUE NÃO O RECONHECE.

    Para todos esses, acho mais útil o comando -io –ignore-case, que retorna em maiúsculas ou minúsculas a palavra-chave que lhe passamos em sua pesquisa.

    NO ENTANTO, TEM UM SÉRIO PROBLEMA PARA BUSCAR PALAVRAS ACENTUADAS E NOSSA CARA EÑE, se queremos buscar «produção» ou «proteção» devemos buscar:

    pdfgrep -i producc file_name.pdf
    pdfgrep -i protect filename.pdf

    (Eu já tentei colocá-lo entre aspas, simples e duplas, o caractere de escape da linguagem C "\" e caracteres curinga e nada). Para pesquisar a palavra-chave “ano”, a verdade é que não consigo pensar em alternativa, quem souber de alguma coisa poste aqui e responda.

    A OPÇÃO MAIS PODEROSA É -ro -recursiva: procura a palavra em TODOS os documentos pdf que temos no diretório em que estamos trabalhando.

    Resumindo, é uma boa ferramenta e como está escrita em software livre podemos modificá-la para que suporte a língua espanhola, obrigado pelo artigo!

  3.   Jimmy olano dito

    LENDO ESTE DOCUMENTO:

    https://pdfgrep.org/doc.html

    Eu descobri e informo que é proposto adicionar o parâmetro «–unac» para lidar com os caracteres acentuados NO ENTANTO, a versão que baixei não tinha suporte a unac porque simplesmente não foi compilada com aquele utilitário, que eles chamam de experimental por o caminho.
    O engraçado é que o comando grep não tem essa limitação, mesmo ao usar o parâmetro -i com grep pode-se pesquisar por "ú" e também retornará "Ú".

    Em qualquer caso, já estou revisando o repositório pdfgrep para ver o que mais eu aprendi sobre ele, ok, eu não incomodo mais (por hoje).