במאמר הבא אנחנו הולכים להסתכל על TextSnatcher. אם אתה אחד מהמשתמשים שבדרך כלל עובדים איתם OCR, אולי תרצה לראות אפליקציה פשוטה הבנויה על גבי אפליקציה מורכבת נהדרת כמו זו טסרקט. אם אתה מחפש דרך קלה ולא מסובכת להעתיק טקסט מתמונות ב-Gnu/Linux, אתה יכול להסתכל על TextSnatcher, זה עשוי להתאים למה שאתה מחפש.
האפשרות של לחלץ טקסט מתמונות, קבצי PDF או דברים דומים, אינו חדש. היום אנחנו יכולים למצוא כלים רבים ושונים לעשות את העבודה הזו, אבל כרגע אף אחד לא עושה את זה בקלות כמו TextSnatcher יכול.
כלי זה מבצע זיהוי תווים אופטי (OCR) תוך שניות, מה שיאפשר למשתמשים העתק במהירות טקסט מכל מה שנראה על המסך ללוח המערכת, מה שהופך אותו מוכן להדבקה במקום אחר. זיהוי תווים, המכונה לעתים קרובות OCR (מזיהוי תווים אופטי באנגלית), הוא תהליך שמטרתו דיגיטציה של טקסטים, המזהים אוטומטית מתמונה, סמלים או תווים השייכים לאלפבית מסוים, ואז מאחסנים אותם כנתונים. אז אנחנו יכולים ליצור אינטראקציה עם אלה באמצעות תוכנית עריכת טקסט.
לגבי הממשק של האפליקציה הזו, זה לא יכול להיות קל יותר לשימוש. נצטרך רק להפעיל אותו, לחץ על כפתור 'חטוף עכשיו!'. לאחר נראה את כלי ברירת המחדל של לכידת מסך מופיע כדי לצלם צילום מסך מלא, לכידת החלון הנוכחי או לבחור אזור לצילום (מומלץ) תוך התמקדות רק בטקסט שאנו רוצים להעתיק.
תכונות כלליות של TextSnatcher
- תוכנית זו תאפשר לנו העתק את הטקסט של תמונות בקלות, נוכל לבצע פעולות OCR תוך שניות, עם תוצאות טובות למדי.
- חשבון עם תמיכה בריבוי שפות. אלה ניתן לבחור מהכפתור בצד שמאל, בחלק העליון של החלון.
- יאפשר לנו העתק את הטקסט של התמונות תוך בחירה של האזור.
- זה תוכנית מהירה וקלה לשימוש.
- יכול להיות ראה כמה סרטונים של תוכנית זו עובדת בה מאגר GitHub.
- האפליקציה הזו משתמש ב-Tesseract OCR 4.x לזיהוי תווים. אם אתה מעוניין לדעת יותר, אתה יכול לקרוא על טסרקט y פרויקט Star Tesseract.
התקן את TextSnatcher על אובונטו
תוכנית זו נוכל למצוא אותו זמין כחבילת Flatpak ב Flathub. אם אתה משתמש באובונטו 20.04 ועדיין לא מופעלת הטכנולוגיה הזו במערכת שלך, תוכל להמשיך המדריך שכתב עמית בבלוג זה לפני זמן מה.
כדי התקן תוכנית זו באובונטו, נצטרך רק לפתוח מסוף (Ctrl + Alt + T) ולבצע בו את הפקודה:
flatpak install flathub com.github.rajsolai.textsnatcher
עם סיום התקנת התוכנה, נצטרך רק לחפש את ה-Launcher במחשב שלנו, או להפעיל בטרמינל כדי התחל את התוכנית:
flatpak run com.github.rajsolai.textsnatcher
אם לאחר הפעלת תוכנה זו, היא לא פועלת כהלכה או שהיא לא מתחילה כלל, ייתכן שיהיה עליך להתקין צילום מסך של gnome. אם זה המקרה, כל שעליך לעשות הוא להקליד מסוף (Ctrl+Alt+T):
sudo apt install gnome-screenshot
הסר את ההתקנה
למקרה שתרצו להסיר את התוכנית מהמערכת שלך, יהיה צורך רק לפתוח מסוף (Ctrl+Alt+T) ולהפעיל את הפקודה בו:
flatpak uninstall com.github.rajsolai.textsnatcher
כלי זה מיועד למערכות הפעלה שונות. למרות שכדי לכתוב מאמר זה, בדקתי אותו רק על אובונטו 20.04/21.10, עם תוצאות טובות בשני המקרים. המנוע Tesseract OCR מפעיל את הכלי הזה והוא עובד נהדר כאשר האזור הנבחר ברזולוציה גבוהה, או שהטקסט להעתקה גדול וברור..
ברזולוציה נמוכה או בלוקים קטנים מאוד של 'טקסט', חלק מהתווים מועתקים לפעמים לגדולים יותר. כמו כן, אם לבחירה יש הרבה קישוט, זה יכול להוביל לתוצאות לא מובנות, שכן הכלי מנסה להקצות תווי טקסט לחלקים של גבולות, תמונות וכו'.