TextSnatcher, αντιγράψτε κείμενο από εικόνες στο πρόχειρο

σχετικά με το textsnatcher

Στο επόμενο άρθρο θα ρίξουμε μια ματιά στο TextSnatcher. Εάν είστε ένας από τους χρήστες που συνήθως συνεργάζονται με OCR, μπορεί να θέλετε να δείτε μια απλή εφαρμογή χτισμένη πάνω από μια εξαιρετική σύνθετη εφαρμογή όπως αυτή τεσεράκτ. αν ψάχνετε ένας εύκολος και απλός τρόπος αντιγραφής κειμένου από εικόνες στο Gnu/Linux, μπορείτε να ρίξετε μια ματιά στο TextSnatcher, μπορεί να ταιριάζει σε αυτό που ψάχνετε.

Η πιθανότητα εξάγετε κείμενο από εικόνες, αρχεία PDF ή παρόμοια πράγματα, δεν είναι κάτι καινούργιο. Σήμερα μπορούμε να βρούμε πολλά διαφορετικά εργαλεία για να κάνουμε αυτή τη δουλειά, αλλά προς το παρόν κανένα δεν το κάνει τόσο εύκολα όσο το TextSnatcher.

Αυτό το εργαλείο εκτελεί οπτική αναγνώριση χαρακτήρων (OCR) σε δευτερόλεπτα, κάτι που θα επιτρέψει στους χρήστες αντιγράψτε γρήγορα κείμενο από οτιδήποτε είναι ορατό στην οθόνη στο πρόχειρο του συστήματος, καθιστώντας το έτοιμο για επικόλληση αλλού. Αναγνώριση χαρακτήρων, συχνά γνωστή ως OCR (από την Αγγλική Οπτική Αναγνώριση Χαρακτήρων), είναι μια διαδικασία που στοχεύει στην ψηφιοποίηση κειμένων, τα οποία αναγνωρίζονται αυτόματα από μια εικόνα, σύμβολα ή χαρακτήρες που ανήκουν σε ένα συγκεκριμένο αλφάβητο και στη συνέχεια τα αποθηκεύουν ως δεδομένα. Έτσι μπορούμε να αλληλεπιδράσουμε με αυτά μέσω ενός προγράμματος επεξεργασίας κειμένου.

διεπαφή textsnatch

Όσο για τη διεπαφή αυτής της εφαρμογής, δεν θα μπορούσε να είναι πιο εύκολη στη χρήση. Θα πρέπει μόνο να το ξεκινήσουμε, κάντε κλικ στο κουμπί «Αρπάξτε τώρα!». Μετά θα δούμε το προεπιλεγμένο εργαλείο λήψης οθόνης να εμφανίζεται για λήψη πλήρους οθόνης, λήψη του τρέχοντος παραθύρου ή επιλογή περιοχής για λήψη (συνιστάται) εστιάζοντας μόνο στο κείμενο που θέλουμε να αντιγράψουμε.

Γενικά χαρακτηριστικά του TextSnatcher

  • Αυτό το πρόγραμμα θα μας επιτρέψει αντιγράψτε το κείμενο των εικόνων με ευκολία, μπορούμε να εκτελέσουμε λειτουργίες OCR σε δευτερόλεπτα, με αρκετά καλά αποτελέσματα.

TextSnatcher γλώσσες

  • Λογαριασμός με υποστήριξη πολλαπλών γλωσσών. Αυτά μπορούν να επιλεγούν από το κουμπί στην αριστερή πλευρά, στο επάνω μέρος του παραθύρου.
  • Θα μας επιτρέψει αντιγράψτε το κείμενο των εικόνων κάνοντας μια επιλογή της περιοχής.

επιλογές αποσπάσματος κειμένου

  • Είναι ένα γρήγορο και εύκολο στη χρήση πρόγραμμα.
  • Μάιος δείτε μερικά βίντεο από αυτό το πρόγραμμα που λειτουργεί του σε Αποθήκη GitHub.
  • Αυτή η εφαρμογή χρησιμοποιεί το Tesseract OCR 4.x για την αναγνώριση χαρακτήρων. Εάν ενδιαφέρεστε να μάθετε περισσότερα, μπορείτε να διαβάσετε σχετικά τεσεράκτ y Star Tesseract Project.

Εγκαταστήστε το TextSnatcher στο Ubuntu

Αυτό το πρόγραμμα μπορούμε να το βρούμε διαθέσιμο ως πακέτο Flatpak στο Flathub. Εάν χρησιμοποιείτε το Ubuntu 20.04 και εξακολουθείτε να μην έχετε ενεργοποιήσει αυτήν την τεχνολογία στο σύστημά σας, μπορείτε να συνεχίσετε Ο οδηγός που ένας συνάδελφος έγραψε σε αυτό το blog πριν από λίγο.

να εγκαταστήστε αυτό το πρόγραμμα στο Ubuntu, θα πρέπει μόνο να ανοίξουμε ένα τερματικό (Ctrl + Alt + T) και να εκτελέσουμε την εντολή σε αυτό:

εγκαταστήστε το textsnatcher

flatpak install flathub com.github.rajsolai.textsnatcher

Όταν ολοκληρωθεί η εγκατάσταση του προγράμματος, θα πρέπει μόνο να αναζητήσουμε τον εκκινητή στον υπολογιστή μας ή να τρέξουμε στο τερματικό για να ξεκινήστε το πρόγραμμα:

εφαρμογή εκκίνησης

flatpak run com.github.rajsolai.textsnatcher

Εάν μετά την εκκίνηση αυτού του λογισμικού, δεν λειτουργεί σωστά ή δεν ξεκινά καθόλου, ίσως χρειαστεί να το εγκαταστήσετε gnome-screenshot. Εάν συμβαίνει αυτό, το μόνο που έχετε να κάνετε είναι να πληκτρολογήσετε ένα τερματικό (Ctrl+Alt+T):

sudo apt install gnome-screenshot

Καταργήστε την εγκατάσταση

Σε περίπτωση που θέλετε αφαιρέστε το πρόγραμμα από το σύστημά σας, θα χρειαστεί μόνο να ανοίξετε ένα τερματικό (Ctrl+Alt+T) και να ξεκινήσετε την εντολή σε αυτό:

απεγκαταστήστε το textsnatcher

flatpak uninstall com.github.rajsolai.textsnatcher

Αυτό το εργαλείο έχει σχεδιαστεί για διαφορετικά λειτουργικά συστήματα. Αν και για να γράψω αυτό το άρθρο, το δοκίμασα μόνο στο Ubuntu 20.04/21.10, με καλά αποτελέσματα και στις δύο περιπτώσεις. Το μοτέρ Το Tesseract OCR τροφοδοτεί αυτό το εργαλείο και λειτουργεί εξαιρετικά όταν η επιλεγμένη περιοχή είναι υψηλής ανάλυσης ή το κείμενο προς αντιγραφή είναι μεγάλο και καθαρό..

Σε χαμηλή ανάλυση ή πολύ μικρά μπλοκ «κειμένου», ορισμένοι χαρακτήρες αντιγράφονται μερικές φορές σε μεγαλύτερους. Επίσης, εάν η επιλογή έχει πολλή διακόσμηση, μπορεί να οδηγήσει σε κάποια ακατανόητα αποτελέσματα, καθώς το εργαλείο προσπαθεί να αντιστοιχίσει χαρακτήρες κειμένου σε μέρη περιγραμμάτων, εικόνων κ.λπ.


Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: Miguel Ángel Gatón
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.