TextSnatcher, copie o texto das imagens para a área de transferência

sobre o sequestrador de textos

No próximo artigo vamos dar uma olhada no TextSnatcher. Se você é um dos usuários que costuma trabalhar com OCR, você pode gostar de ver um aplicativo simples construído em cima de um ótimo aplicativo complexo como este Tesseract. Se você está procurando uma maneira fácil e descomplicada de copiar texto de imagens no Gnu/Linux, você pode dar uma olhada no TextSnatcher, pode se adequar ao que você está procurando.

A possibilidade de extrair texto de imagens, arquivos PDF ou coisas semelhantes, não é novidade. Hoje podemos encontrar muitas ferramentas diferentes para fazer esse trabalho, mas no momento nenhuma faz isso tão facilmente quanto o TextSnatcher.

Esta ferramenta realiza o reconhecimento óptico de caracteres (OCR) em segundos, o que permitirá aos usuários copie rapidamente o texto de qualquer coisa visível na tela para a área de transferência do sistema, deixando-o pronto para colar em outro lugar. Reconhecimento de caracteres, muitas vezes conhecido como OCR (do Inglês Reconhecimento Óptico de Caracteres), é um processo que visa a digitalização de textos, que identificam automaticamente a partir de uma imagem, símbolos ou caracteres pertencentes a um determinado alfabeto, e depois os armazenam como dados. Assim, podemos interagir com eles através de um programa de edição de texto.

interface de captura de texto

Quanto à interface deste aplicativo, não poderia ser mais fácil de usar. Nós só teremos que iniciá-lo, clique no botão 'Snatch Now!'. Depois de veremos a ferramenta de captura de tela padrão aparecer para fazer uma captura de tela inteira, uma captura da janela atual ou selecionar uma área para capturar (recomendado) focando apenas no texto que queremos copiar.

Recursos gerais do TextSnatcher

  • Este programa nos permitirá copie o texto das imagens com facilidade, podemos realizar operações de OCR em segundos, com resultados bastante bons.

Idiomas do TextSnatcher

  • Tem suporte a vários idiomas. Estes podem ser selecionados a partir do botão do lado esquerdo, na parte superior da janela.
  • Nos permitirá copie o texto das imagens fazendo uma seleção da área.

opções de captura de texto

  • É um programa rápido e fácil de usar.
  • Maio veja alguns videos deste programa funcionando na sua Repositório GitHub.
  • Esta aplicação usa o Tesseract OCR 4.x para reconhecimento de caracteres. Se você estiver interessado em saber mais, você pode ler sobre Tesseract y Projeto Star Tesseract.

Instale o TextSnatcher no Ubuntu

Este programa podemos encontrá-lo disponível como um pacote Flatpak em Flathub. Se você usa o Ubuntu 20.04 e ainda não tem essa tecnologia habilitada em seu sistema, pode continuar a guia que um colega escreveu neste blog há algum tempo.

Pára instale este programa no Ubuntu, só teremos que abrir um terminal (Ctrl + Alt + T) e executar o comando nele:

instalar textnatcher

flatpak install flathub com.github.rajsolai.textsnatcher

Quando a instalação do programa estiver concluída, basta procurar o inicializador em nosso computador ou executar no terminal para inicie o programa:

inicializador de aplicativo

flatpak run com.github.rajsolai.textsnatcher

Se depois de iniciar este software, ele não funcionar corretamente ou não iniciar, talvez seja necessário instalar captura de tela do gnome. Se este for o caso, tudo o que você precisa fazer é digitar em um terminal (Ctrl+Alt+T):

sudo apt install gnome-screenshot

Desinstalar

Caso você queira remova o programa do seu sistema, será necessário apenas abrir um terminal (Ctrl+Alt+T) e lançar o comando nele:

desinstalar o sequestrador de texto

flatpak uninstall com.github.rajsolai.textsnatcher

Esta ferramenta é projetada para diferentes sistemas operacionais. Embora para escrever este artigo, testei-o apenas no Ubuntu 20.04/21.10, com bons resultados em ambos os casos. O motor O Tesseract OCR potencializa essa ferramenta e funciona muito bem quando a área selecionada é de alta resolução ou o texto a ser copiado é grande e claro..

Em blocos de 'texto' muito pequenos ou de baixa resolução, alguns caracteres às vezes são copiados para. Além disso, se a seleção tiver muita decoração, pode levar a alguns resultados incompreensíveis, pois a ferramenta tenta atribuir caracteres de texto a partes de bordas, imagens etc.


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: Miguel Ángel Gatón
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.