eSpeak NG, un sintetizador de texto a voz para Linux

about espeak-ng

En el siguiente artículo vamos a echar un vistazo a eSpeak NG. Este es un software sintetizador de voz, multilingüe y para la línea de comandos, en el que podremos utilizar más de 100 idiomas. eSpeak NG es una versión actualizada del motor eSpeak creado por Jonathan Duddington, y sobre el que ya hablamos en un artículo anterior en este mismo blog.

Este programa va a leer en voz alta el texto que nosotros le proporcionemos. Además puede tomar el texto bien sea de una entrada estándar o desde un archivo. El programa usa texto a voz para hablar a través del dispositivo de sonido predeterminado. Este software puede resultar de ayuda a la hora de escuchar blogs, sitios de noticias o en caso de que necesitemos convertir archivos de texto a voz para personas con discapacidad visual. eSpeak incluye diferentes voces y sus características pueden modificarse según necesitemos.

Al utilizar el programa te darás cuenta de que el habla puede llegar a ser bastante clara, pero que nadie se espere algo tan natural o suave como las voces de los sintetizadores que se basan en grabaciones de habla humana. Como decía líneas más arriba, eSpeak NG hace síntesis de texto a voz para más de 100 idiomas y acentos, pero según parece, algunos idiomas los lee mejor que otros.

Características generales de eSpeak NG

  • Esta es una aplicación multiplataforma que admite Gnu/Linux, Android, Mac OS y Windows.
  • Se trata de un programa gratuito de código abierto, que sido escrito en C.
  • Incluye diferentes voces, cuyas características pueden modificarse.
  • Puede producir una salida de voz como un archivo WAV o mp3, en lugar de hablar directamente. El archivo resultante se puede reproducir en cualquier reproductor multimedia.
  • También puede traducir texto en códigos de fonemas, por lo que podría adaptarse como interfaz para otro motor de síntesis de voz.
  • El programa tiene potencial para otros idiomas. Los idiomas que utiliza están en distintas etapas de progreso. Según indica el creador, se agradece la ayuda de hablantes nativos de estos u otros idiomas.

El código fuente del proyecto eSpeak NG está alojado en GitHub, al igual que el todas sus características en detalle.

Instalar eSpeak NG en Ubuntu

Este programa lo podemos encontrar empaquetado para diferentes sistemas Gnu/Linux. En Ubuntu, Debian y sus derivados, solo necesitaremos utilizar APT en una terminal (Ctrl+Alt+T) de la siguiente forma:

instalar eSpeak ng

sudo apt install espeak-ng

Un vistazo rápido al programa

eSpeak NG es totalmente compatible con su predecesor. Además utiliza las mismas opciones de línea de comando que eSpeak, y añade algunas funcionalidades más. Entre ellas podemos encontrar las siguientes:

Una frase en voz alta

Podemos indicar al programa que lea una frase en voz alta:

espeak-ng "Esto es un lo que va a leer el programa"

Además el programa también puede leer el contenido de un archivo en voz alta:

espeak-ng -f archivo.txt

También nos va a dar la posibilidad de leer la entrada de texto de la entrada estándar:

espeak-ng

Para salir solo es necesario utilizar la combinación CTRL+C.

Guardar la salida en un un archivo

Si te interesa guardar la salida en un archivo de audio MP3, tan solo es necesario utilizar la opción -w de la siguiente forma:

espeak-ng -w audio.mp3 "espeak ng va a guardar esto en un archivo mp3"

En caso de que te interese un archivo .wav, en el comando anterior solo habría que cambiar la extensión del archivo de salida.

Imprimir los fonemas de un texto

El siguiente comando va a pronunciar la palabra ‘Ubuntu‘ e imprimirá los fonemas:

fonemas de Ubuntu

espeak-ng -x Ubuntu

Enumerar las voces admitida

Este programa admite varias voces diferentes, y las podremos enumerarlas todas con el comando:

listado de voces

espeak-ng --voices

También se pueden enumerar todas las voces que hablan un idioma específico. Si por ejemplo queremos ver las voces que hablan español (es), solo habría que utilizar el comando:

listado de voces en español

espeak-ng --voices=es

Cambiar la voz

eSpeak NG pronunciará por defecto el texto dado utilizando la voz en inglés. Si quieres utilizar una voz diferente, ejecuta algo como lo siguiente:

espeak-ng -v nombre_de_voz

Ayuda

Las que acabamos de ver, son solo algunas de las posibilidades de este programa. Para obtener información detallada de cómo utilizar eSpeak NG, solo será necesario escribir en la terminal (Ctrl+Alt+T):

ayuda de la aplicación

espeak-ng --help

O también podremos consultar las páginas de manual:

man espeak-ng

Desinstalar eSpeak NG

Si quieres eliminar este programa de tu equipo, en una terminal (Ctrl+Alt+T) no hay más que ejecutar:

desinstalar eSpeak NG

sudo apt remove espeak-ng

Si te interesa poder disponer de una interfaz gráfica de este programa, puedes dirigirte a la página para descargar gespeaker. En ella podrás descargarte el archivo .deb para instalarlo.

Se puede saber más acerca de este proyecto en su repositorio de GitHub.


Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Miguel Ángel Gatón
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.

  1.   Jacobo dijo

    Que bueno que hay algo para nuestra distro, aunque la voz es una mierda.