TextSnatcher, copia el text d'imatges al porta-retalls

about textsnatcher

En el següent article anem a fer una ullada a TextSnatcher. Si ets dels usuaris que treballen habitualment amb OCR, possiblement t'agradarà veure una aplicació simple creada sobre una aplicació excel·lent i complexa com és tesseract. si busques una manera fàcil i sense complicacions de copiar el text d'imatges a Gnu/Linux, pots fer una ullada a TextSnatcher, ja que és possible que adapti al que busques.

La possibilitat de extreure text d'imatges, fitxers PDF o coses similars, no és cap novetat. Avui dia podem trobar moltes i diferents eines per realitzar aquest treball, però de moment cap ho fa de manera tan fàcil com ho pot fer TextSnatcher.

Aquesta eina realitza el reconeixement òptic de caràcters (OCR) en segons, el que permetrà als usuaris copiar ràpidament text de qualsevol cosa visible a la pantalla al porta-retalls del sistema, deixant-ho llest per enganxar-lo en un altre lloc. El reconeixement de caràcters, conegut sovint com a OCR (de l'anglès Optical Character Recognition), és un procés dirigit a la digitalització de textos, els quals identifiquen automàticament a partir d'una imatge, símbols o caràcters que pertanyen a un determinat alfabet, per després emmagatzemar-los en forma de dades. Així podrem interactuar amb aquests mitjançant un programa dedició de text.

interfície textsnatcher

Quant a la interfície daquesta aplicació, no podria ser més fàcil dusar. Només haurem d'iniciar-la, fer clic al botó 'Snatch Now!'. Després veurem aparèixer l'eina de captura de pantalla predeterminada per prendre una captura de pantalla completa, una captura de la finestra actual o seleccionar una zona de capturar (recomanat) enfocant-se només en el text que ens interessi copiar.

Característiques generals de TextSnatcher

  • Aquest programa ens permetrà copiar el text d'imatges amb facilitat, podrem fer operacions d'OCR en segons, amb força bons resultats.

idiomes TextSnatcher

  • compta amb suport de múltiples idiomes. Aquests es poden seleccionar al botó del costat esquerre, a la part superior de la finestra.
  • Ens permetrà copiar el text de les imatges fent una selecció de la zona.

opcions de textsnatcher

  • Es tracta d' un programa ràpid i fàcil d'usar.
  • es poden veure alguns vídeos d'aquest programa funcionant en el seu repositori de GitHub.
  • aquesta aplicació utilitza Tesseract OCR 4.x per al reconeixement de caràcters. Si t'interessa saber-ne més, pots llegir sobre tesseract y Star Tesseract-Project.

Instal·lar TextSnatcher a Ubuntu

aquest programa el podem trobar disponible com a paquet Flatpak a Flathub. Si fas servir Ubuntu 20.04 i encara no comptes amb aquesta tecnologia habilitada en el teu sistema, pots seguir la guia que va escriure un company en aquest blog fa un temps.

Per a la instal·lar aquest programa a Ubuntu, Tan sols haurem d'obrir una terminal (Ctrl + Alt + T) i executar-hi la comanda:

instal·lar textsnatcher

flatpak install flathub com.github.rajsolai.textsnatcher

Quan finalitzi la instal·lació del programa, tan sols haurem de buscar el llançador al nostre equip, o executar a la terminal per iniciar el programa:

llançador de l'aplicació

flatpak run com.github.rajsolai.textsnatcher

Si després d'iniciar aquest programari, aquest no funciona correctament o directament no arrenca, és possible que necessitis instal·lar gnome-screenshot. Si aquest és el cas, només haureu d'escriure en una terminal (Ctrl+Alt+T):

sudo apt install gnome-screenshot

Desinstal

En cas que vulguis eliminar el programa del teu sistema, tan sols caldrà obrir una terminal (Ctrl+Alt+T) i llançar-hi l'ordre:

desinstal·lar textsnatcher

flatpak uninstall com.github.rajsolai.textsnatcher

Aquesta eina està dissenyada per a diferents sistemes operatius. Tot i que per escriure aquest article, només ho vaig provar a Ubuntu 20.04/21.10, amb bons resultats en tots dos casos. El motor Tesseract OCR impulsa aquesta eina i funciona molt bé quan làrea seleccionada és dalta resolució, o el text per copiar és gran i clar.

En blocs de 'text' de baixa resolució o molt petits, de vegades es copien alguns caràcters a majors. A més, si la selecció compta amb molta decoració, pot donar lloc a alguns resultats incomprensibles, ja que l'eina intenta assignar caràcters de text a parts de vores, imatges, etc.


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: Miguel Ángel Gatón
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.