Trong phần tiếp theo, chúng ta sẽ tìm hiểu về eSpeak NG. Đây là một phần mềm tổng hợp giọng nói dòng lệnh, đa ngôn ngữ, trong đó chúng tôi có thể sử dụng hơn 100 ngôn ngữ. eSpeak NG là một phiên bản cập nhật của công cụ eSpeak do Jonathan Duddington tạo ra và về cái mà chúng ta đã nói trong một bài trước trong cùng một blog này.
Chương trình này sẽ đọc to văn bản mà chúng tôi cung cấp. Bạn cũng có thể lấy văn bản từ đầu vào chuẩn hoặc từ một tệp. Chương trình sử dụng văn bản thành giọng nói để nói thông qua thiết bị âm thanh mặc định. Phần mềm này có thể hữu ích khi nghe blog, trang tin tức hoặc trong trường hợp chúng ta cần chuyển đổi văn bản sang tệp giọng nói cho người khiếm thị. eSpeak bao gồm các giọng nói khác nhau và đặc điểm của chúng có thể được sửa đổi khi cần thiết.
Khi sử dụng chương trình, bạn sẽ nhận thấy rằng giọng nói có thể trở nên khá rõ ràng, nhưng không ai mong đợi điều gì đó tự nhiên hoặc mượt mà như giọng nói của bộ tổng hợp dựa trên bản ghi âm giọng nói của con người. Như tôi đã nói ở trên, eSpeak NG thực hiện tổng hợp văn bản thành giọng nói cho hơn 100 ngôn ngữ và trọng âm, nhưng dường như, một số ngôn ngữ đọc tốt hơn những ngôn ngữ khác.
Các tính năng chung của ESpeak NG
- Đây là một ứng dụng đa nền tảng hỗ trợ Gnu / Linux, Android, Mac OS và Windows.
- Đó là về một chương trình mã nguồn mở miễn phí, được viết bằng C.
- Bao gồm những giọng nói khác nhau, có thể sửa đổi các đặc điểm của nó.
- Bạn có thể tạo đầu ra bằng giọng nói dưới dạng tệp WAV hoặc mp3, thay vì nói trực tiếp. Tệp kết quả có thể được phát trên bất kỳ trình phát đa phương tiện nào.
- Cũng có thể dịch văn bản thành mã âm vị, vì vậy nó có thể được điều chỉnh làm giao diện cho một công cụ tổng hợp giọng nói khác.
- Chương trình có tiềm năng cho các ngôn ngữ khác. Các ngôn ngữ bạn sử dụng đang ở các giai đoạn tiến triển khác nhau. Theo người sáng tạo, sự giúp đỡ của những người bản ngữ nói những ngôn ngữ này hoặc ngôn ngữ khác được đánh giá cao.
Mã nguồn của dự án eSpeak NG là được lưu trữ trên GitHub, giống như tất cả các tính năng của nó một cách chi tiết.
Cài đặt eSpeak NG trên Ubuntu
Chương trình này có thể được đóng gói cho các hệ thống Gnu / Linux khác nhau. Trong Ubuntu, Debian và các dẫn xuất của chúng, chúng tôi sẽ chỉ cần sử dụng APT trong một thiết bị đầu cuối (Ctrl + Alt + T) như sau:
sudo apt install espeak-ng
Xem nhanh chương trình
eSpeak NG hoàn toàn tương thích với người tiền nhiệm của nó. Còn gì nữa sử dụng các tùy chọn dòng lệnh tương tự như eSpeak và thêm một số chức năng khác. Trong số đó, chúng ta có thể tìm thấy những điều sau:
Một cụm từ thành tiếng
Chúng ta có thể hướng dẫn chương trình đọc to một câu:
espeak-ng "Esto es un lo que va a leer el programa"
Ngoài ra, chương trình cũng có thể đọc to nội dung của một tập tin:
espeak-ng -f archivo.txt
Nó cũng sẽ cung cấp cho chúng tôi khả năng đọc đầu vào văn bản từ đầu vào tiêu chuẩn:
espeak-ng
Để thoát, bạn chỉ cần sử dụng tổ hợp CTRL + C.
Lưu đầu ra vào một tệp
Nếu bạn quan tâm lưu đầu ra thành tệp âm thanh MP3, chỉ cần sử dụng tùy chọn -w như sau:
espeak-ng -w audio.mp3 "espeak ng va a guardar esto en un archivo mp3"
Trong trường hợp bạn quan tâm một tệp .wav, trong lệnh trước, bạn sẽ chỉ phải thay đổi phần mở rộng của tệp đầu ra.
In các âm vị của văn bản
Lệnh sau sẽ phát âm từ 'Ubuntu'và nó sẽ in các âm vị:
espeak-ng -x Ubuntu
Liệt kê các giọng nói được hỗ trợ
Chương trình này hỗ trợ một số giọng nói khác nhau và chúng tôi sẽ có thể liệt kê tất cả với lệnh:
espeak-ng --voices
Tất cả các giọng nói nói một ngôn ngữ cụ thể cũng có thể được liệt kê. Ví dụ, nếu chúng tôi muốn xem những giọng nói tiếng Tây Ban Nha, bạn chỉ cần sử dụng lệnh:
espeak-ng --voices=es
Thay đổi giọng nói
eSpeak NG sẽ phát âm theo mặc định văn bản đã cho bằng giọng nói tiếng Anh. Nếu bạn muốn sử dụng một giọng nói khác, hãy chạy một cái gì đó như sau:
espeak-ng -v nombre_de_voz
Giúp
Những cái chúng ta vừa thấy chỉ là một số khả năng của chương trình này. Vì nhận thông tin chi tiết về cách sử dụng eSpeak NG, chỉ cần viết trong terminal (Ctrl + Alt + T):
espeak-ng --help
Hoặc chúng ta cũng có thể tham khảo các trang hướng dẫn sử dụng:
man espeak-ng
Gỡ cài đặt eSpeak NG
Nếu bạn muốn xóa chương trình này khỏi máy tính của bạn, trong một terminal (Ctrl + Alt + T), bạn chỉ cần thực thi:
sudo apt remove espeak-ng
Nếu bạn quan tâm đến việc có một giao diện đồ họa cho chương trình này, bạn có thể truy cập trang để tải xuống gespeaker. Trong đó, bạn có thể tải xuống tệp .deb để cài đặt nó.
Nó có thể biết thêm về dự án này tại kho lưu trữ GitHub của bạn.
Thật tốt khi có một cái gì đó cho bản phân phối của chúng tôi, mặc dù giọng nói thật tệ.