eSpeak NG, một bộ tổng hợp văn bản thành giọng nói cho Linux

về espeak-ng

Trong phần tiếp theo, chúng ta sẽ tìm hiểu về eSpeak NG. Đây là một phần mềm tổng hợp giọng nói dòng lệnh, đa ngôn ngữ, trong đó chúng tôi có thể sử dụng hơn 100 ngôn ngữ. eSpeak NG là một phiên bản cập nhật của công cụ eSpeak do Jonathan Duddington tạo ra và về cái mà chúng ta đã nói trong một bài trước trong cùng một blog này.

Chương trình này sẽ đọc to văn bản mà chúng tôi cung cấp. Bạn cũng có thể lấy văn bản từ đầu vào chuẩn hoặc từ một tệp. Chương trình sử dụng văn bản thành giọng nói để nói thông qua thiết bị âm thanh mặc định. Phần mềm này có thể hữu ích khi nghe blog, trang tin tức hoặc trong trường hợp chúng ta cần chuyển đổi văn bản sang tệp giọng nói cho người khiếm thị. eSpeak bao gồm các giọng nói khác nhau và đặc điểm của chúng có thể được sửa đổi khi cần thiết.

Khi sử dụng chương trình, bạn sẽ nhận thấy rằng giọng nói có thể trở nên khá rõ ràng, nhưng không ai mong đợi điều gì đó tự nhiên hoặc mượt mà như giọng nói của bộ tổng hợp dựa trên bản ghi âm giọng nói của con người. Như tôi đã nói ở trên, eSpeak NG thực hiện tổng hợp văn bản thành giọng nói cho hơn 100 ngôn ngữ và trọng âm, nhưng dường như, một số ngôn ngữ đọc tốt hơn những ngôn ngữ khác.

Các tính năng chung của ESpeak NG

  • Đây là một ứng dụng đa nền tảng hỗ trợ Gnu / Linux, Android, Mac OS và Windows.
  • Đó là về một chương trình mã nguồn mở miễn phí, được viết bằng C.
  • Bao gồm những giọng nói khác nhau, có thể sửa đổi các đặc điểm của nó.
  • Bạn có thể tạo đầu ra bằng giọng nói dưới dạng tệp WAV hoặc mp3, thay vì nói trực tiếp. Tệp kết quả có thể được phát trên bất kỳ trình phát đa phương tiện nào.
  • Cũng có thể dịch văn bản thành mã âm vị, vì vậy nó có thể được điều chỉnh làm giao diện cho một công cụ tổng hợp giọng nói khác.
  • Chương trình có tiềm năng cho các ngôn ngữ khác. Các ngôn ngữ bạn sử dụng đang ở các giai đoạn tiến triển khác nhau. Theo người sáng tạo, sự giúp đỡ của những người bản ngữ nói những ngôn ngữ này hoặc ngôn ngữ khác được đánh giá cao.

Mã nguồn của dự án eSpeak NG là được lưu trữ trên GitHub, giống như tất cả các tính năng của nó một cách chi tiết.

Cài đặt eSpeak NG trên Ubuntu

Chương trình này có thể được đóng gói cho các hệ thống Gnu / Linux khác nhau. Trong Ubuntu, Debian và các dẫn xuất của chúng, chúng tôi sẽ chỉ cần sử dụng APT trong một thiết bị đầu cuối (Ctrl + Alt + T) như sau:

cài đặt eSpeak ng

sudo apt install espeak-ng

Xem nhanh chương trình

eSpeak NG hoàn toàn tương thích với người tiền nhiệm của nó. Còn gì nữa sử dụng các tùy chọn dòng lệnh tương tự như eSpeak và thêm một số chức năng khác. Trong số đó, chúng ta có thể tìm thấy những điều sau:

Một cụm từ thành tiếng

Chúng ta có thể hướng dẫn chương trình đọc to một câu:

espeak-ng "Esto es un lo que va a leer el programa"

Ngoài ra, chương trình cũng có thể đọc to nội dung của một tập tin:

espeak-ng -f archivo.txt

Nó cũng sẽ cung cấp cho chúng tôi khả năng đọc đầu vào văn bản từ đầu vào tiêu chuẩn:

espeak-ng

Để thoát, bạn chỉ cần sử dụng tổ hợp CTRL + C.

Lưu đầu ra vào một tệp

Nếu bạn quan tâm lưu đầu ra thành tệp âm thanh MP3, chỉ cần sử dụng tùy chọn -w như sau:

espeak-ng -w audio.mp3 "espeak ng va a guardar esto en un archivo mp3"

Trong trường hợp bạn quan tâm một tệp .wav, trong lệnh trước, bạn sẽ chỉ phải thay đổi phần mở rộng của tệp đầu ra.

In các âm vị của văn bản

Lệnh sau sẽ phát âm từ 'Ubuntu'và nó sẽ in các âm vị:

Âm vị Ubuntu

espeak-ng -x Ubuntu

Liệt kê các giọng nói được hỗ trợ

Chương trình này hỗ trợ một số giọng nói khác nhau và chúng tôi sẽ có thể liệt kê tất cả với lệnh:

danh sách giọng nói

espeak-ng --voices

Tất cả các giọng nói nói một ngôn ngữ cụ thể cũng có thể được liệt kê. Ví dụ, nếu chúng tôi muốn xem những giọng nói tiếng Tây Ban Nha, bạn chỉ cần sử dụng lệnh:

danh sách các giọng nói bằng tiếng Tây Ban Nha

espeak-ng --voices=es

Thay đổi giọng nói

eSpeak NG sẽ phát âm theo mặc định văn bản đã cho bằng giọng nói tiếng Anh. Nếu bạn muốn sử dụng một giọng nói khác, hãy chạy một cái gì đó như sau:

espeak-ng -v nombre_de_voz

Giúp

Những cái chúng ta vừa thấy chỉ là một số khả năng của chương trình này. Vì nhận thông tin chi tiết về cách sử dụng eSpeak NG, chỉ cần viết trong terminal (Ctrl + Alt + T):

ứng dụng trợ giúp

espeak-ng --help

Hoặc chúng ta cũng có thể tham khảo các trang hướng dẫn sử dụng:

man espeak-ng

Gỡ cài đặt eSpeak NG

Nếu bạn muốn xóa chương trình này khỏi máy tính của bạn, trong một terminal (Ctrl + Alt + T), bạn chỉ cần thực thi:

gỡ cài đặt eSpeak NG

sudo apt remove espeak-ng

Nếu bạn quan tâm đến việc có một giao diện đồ họa cho chương trình này, bạn có thể truy cập trang để tải xuống gespeaker. Trong đó, bạn có thể tải xuống tệp .deb để cài đặt nó.

Nó có thể biết thêm về dự án này tại kho lưu trữ GitHub của bạn.


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

  1.   Gia-cốp dijo

    Thật tốt khi có một cái gì đó cho bản phân phối của chúng tôi, mặc dù giọng nói thật tệ.