eSpeak NG, מסנתז טקסט לדיבור עבור לינוקס

לגבי espeak-ng

במאמר הבא אנו נסתכל על eSpeak NG. זה תוכנת סינתיסייזר דיבור רב לשוני, שורת פקודה, בהן אנו יכולים להשתמש ביותר ממאה שפות. eSpeak NG היא גרסה מעודכנת של מנוע eSpeak שיצר ג'ונתן דדינגטון, ועליו כבר דיברנו ב- מאמר קודם באותו בלוג זה.

תוכנית זו תקרא בקול רם את הטקסט שאנו מספקים. תוכל גם לתפוס את הטקסט מתוך קלט רגיל או מקובץ. התוכנית משתמשת בטקסט לדיבור כדי לדבר באמצעות מכשיר הצליל המוגדר כברירת מחדל. תוכנה זו יכולה להועיל בעת האזנה לבלוגים, לאתרי חדשות, או למקרה שנצטרך להמיר טקסט לקובצי דיבור לקויי ראייה. eSpeak כולל קולות שונים וניתן לשנות את מאפייניהם לפי הצורך.

על ידי שימוש בתוכנית תבחין שהדיבור יכול להיות ברור למדי, אבל אף אחד לא מצפה למשהו טבעי או חלק כמו קולות סינתיסייזר המבוססים על הקלטות דיבור אנושי. כפי שאמרתי למעלה, eSpeak NG מבצע סינתזה של טקסט לדיבור ביותר מ -100 שפות ומבטאים, אך ככל הנראה, חלק מהשפות קוראות טוב יותר מאחרים.

תכונות כלליות של ESpeak NG

  • זה יישום חוצה פלטפורמות התומך ב- Gnu / Linux, Android, Mac OS ו- Windows.
  • זה תוכנית קוד פתוח בחינם, אשר נכתב ב- C.
  • כולל קולות שונים, שניתן לשנות את מאפייניו.
  • יכול לייצר פלט קולי כקובץ WAV או mp3, במקום לדבר ישירות. ניתן להפעיל את הקובץ המתקבל בכל נגן מדיה.
  • יכול גם לתרגם טקסט לקודי פונמות, כך שניתן יהיה להתאים אותו כממשק למנוע אחר לסינתזת דיבור.
  • לתוכנית יש פוטנציאל לשפות אחרות. השפות שבהן אתה משתמש נמצאות בשלבי התקדמות שונים. לדברי היוצר, העזרה של דוברי שפת אם או שפות אחרות מוערכת.

קוד המקור של פרויקט eSpeak NG הוא מתארח ב- GitHub, כמו כל התכונות שלו בפירוט.

התקן eSpeak NG באובונטו

אנו יכולים למצוא תוכנית זו ארוזה עבור מערכות Gnu / Linux שונות. באובונטו, דביאן ונגזרותיהם, נצטרך להשתמש ב- APT רק במסוף (Ctrl + Alt + T) כדלקמן:

התקן eSpeak ng

sudo apt install espeak-ng

מבט מהיר על התוכנית

eSpeak NG תואם באופן מלא את קודמו. מה עוד משתמש באותן אפשרויות שורת הפקודה כמו eSpeak, ומוסיף עוד פונקציונליות. ביניהם אנו יכולים למצוא את הדברים הבאים:

משפט בקול רם

אנחנו יכולים להנחות את התוכנית לקרוא משפט בקול רם:

espeak-ng "Esto es un lo que va a leer el programa"

בנוסף, התוכנית יכולה גם קרא את תוכן הקובץ בקול רם:

espeak-ng -f archivo.txt

זה גם ייתן לנו את היכולת לקרוא קלט טקסט מתוך קלט רגיל:

espeak-ng

כדי לצאת אתה רק צריך להשתמש בשילוב CTRL + C.

שמור את הפלט לקובץ

אם אתה מעוניין שמור את הפלט לקובץ שמע MP3, יש צורך להשתמש רק באפשרות -w כדלקמן:

espeak-ng -w audio.mp3 "espeak ng va a guardar esto en un archivo mp3"

למקרה שאתה מעוניין קובץ .wav, בפקודה לעיל עליך רק לשנות את הסיומת של קובץ הפלט.

הדפס את פונמות הטקסט

הפקודה הבאה תרצה לבטא את המילה 'אובונטו'וזה ידפיס את הפונמות:

פונמות אובונטו

espeak-ng -x Ubuntu

רשום את הקולות הנתמכים

תוכנית זו תומכת במספר קולות שונים, ונוכל רשום את כולם עם הפקודה:

רשימת קולות

espeak-ng --voices

ניתן לרשום גם את כל הקולות המדברים בשפה ספציפית. אם למשל נרצה לראות את הקולות המדברים ספרדית, אתה רק צריך להשתמש בפקודה:

רשימת קולות בספרדית

espeak-ng --voices=es

שנה קול

eSpeak NG יבטא כברירת מחדל את הטקסט הנתון באמצעות הקול האנגלי. אם אתה רוצה להשתמש בקול אחר, הפעל משהו כמו הדבר הבא:

espeak-ng -v nombre_de_voz

עזרה

אלה שראינו זה עתה הם רק חלק מהאפשרויות של תוכנית זו. ל קבל מידע מפורט אודות אופן השימוש ב- eSpeak NG, יהיה צורך לכתוב רק במסוף (Ctrl + Alt + T):

עזרה באפליקציה

espeak-ng --help

או שנוכל להתייעץ גם עם דפי ההוראות:

man espeak-ng

הסר את ההתקנה של eSpeak NG

אם אתה רוצה הסר תוכנית זו מהמחשב שלך, במסוף (Ctrl + Alt + T) אתה רק צריך לבצע:

הסר את ההתקנה של eSpeak NG

sudo apt remove espeak-ng

אם אתה מעוניין לקבל ממשק גרפי לתוכנית זו, תוכל לעבור לדף אל הורד את הדובר. ניתן להוריד בו את קובץ .deb כדי להתקין אותו.

זה יכול לדעת יותר על הפרויקט הזה ב מאגר GitHub שלך.


השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי לנתונים: מיגל אנחל גטון
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.

  1.   יעקובו דיג'ו

    טוב שיש משהו לדיסטרו שלנו, למרות שהקול חרא.