Nel prossimo articolo daremo un'occhiata a TextSnatcher. Se sei uno degli utenti con cui di solito lavora OCR, ti potrebbe piacere vedere un'app semplice costruita su un'app complessa come questa Tesseract. Se stai cercando un modo semplice e senza complicazioni per copiare il testo dalle immagini in Gnu/Linux, puoi dare un'occhiata a TextSnatcher, poiché potrebbe adattarsi a ciò che stai cercando.
La possibilità di estrarre testo da immagini, file PDF o cose simili, non è una novità. Oggi possiamo trovare molti strumenti diversi per fare questo lavoro, ma al momento nessuno lo fa facilmente come fa TextSnatcher.
Questo strumento esegue il riconoscimento ottico dei caratteri (OCR) in secondi, che consentirà agli utenti copia rapidamente il testo da qualsiasi cosa visibile sullo schermo negli appunti di sistema, rendendolo pronto per essere incollato altrove. Riconoscimento dei caratteri, spesso noto come OCR (dall'inglese Riconoscimento ottico dei caratteri), è un processo volto alla digitalizzazione di testi, che identificano automaticamente da un'immagine, simboli o caratteri che appartengono a un determinato alfabeto, e poi li memorizzano come dati. Quindi possiamo interagire con questi attraverso un programma di modifica del testo.
Per quanto riguarda l'interfaccia di questa app, non potrebbe essere più facile da usare. Dovremo solo avviarlo, fare clic sul pulsante "Snatch Now!". A seguito di vedremo apparire lo strumento screenshot predefinito per acquisire uno screenshot a schermo intero, uno screenshot della finestra corrente o selezionare un'area da catturare (recomendado) concentrandoci solo sul testo che vogliamo copiare.
Caratteristiche generali di TextSnatcher
- Questo programma ce lo permetterà copia il testo delle immagini con facilità, possiamo eseguire operazioni OCR in pochi secondi, con risultati abbastanza buoni.
- Ha supporto in più lingue. Questi possono essere selezionati dal pulsante sul lato sinistro, nella parte superiore della finestra.
- Ci permetterà copiare il testo delle immagini effettuando una selezione dell'area.
- È un programma veloce e facile da usare.
- Maggio guarda alcuni video di questo programma funzionante nella loro Repository GitHub.
- Questa applicazione utilizza Tesseract OCR 4.x per il riconoscimento dei caratteri. Se sei interessato a saperne di più, puoi leggere Tesseract y Star Tesseract-Progetto.
Installa TextSnatcher su Ubuntu
Il programma possiamo trovarlo disponibile come pacchetto Flatpak all'indirizzo Flathub. Se usi Ubuntu 20.04 e ancora non hai questa tecnologia abilitata sul tuo sistema, puoi continuare la guida che un collega ha scritto su questo blog tempo fa.
a installa questo programma su Ubuntu, dovremo solo aprire un terminale (Ctrl + Alt + T) ed eseguire il comando al suo interno:
flatpak install flathub com.github.rajsolai.textsnatcher
Al termine dell'installazione del programma, dovremo solo cercare il launcher sul nostro computer, oppure eseguire nel terminale per avviare il programma:
flatpak run com.github.rajsolai.textsnatcher
Se dopo aver avviato questo software, non funziona correttamente o non si avvia affatto, potrebbe essere necessario installarlo screenshot dello gnomo. Se questo è il caso, tutto ciò che devi fare è digitare un terminale (Ctrl+Alt+T):
sudo apt install gnome-screenshot
disinstallazione
Nel caso tu voglia rimuovi il programma dal tuo sistema, sarà solo necessario aprire un terminale (Ctrl+Alt+T) e lanciare il comando in esso:
flatpak uninstall com.github.rajsolai.textsnatcher
Questo strumento è progettato per diversi sistemi operativi. Anche se per scrivere questo articolo l'ho testato solo su Ubuntu 20.04/21.10, con buoni risultati in entrambi i casi. Il motore Tesseract OCR alimenta questo strumento e funziona alla grande quando l'area selezionata è ad alta risoluzione o il testo da copiare è grande e chiaro..
Nei blocchi di "testo" a risoluzione molto piccola o bassa, alcuni caratteri vengono talvolta copiati in dimensioni maggiori. Inoltre, se la selezione ha molte decorazioni, può portare a risultati incomprensibili, poiché lo strumento cerca di assegnare caratteri di testo a parti di bordi, immagini, ecc.