Mozilla đang làm việc để phát triển hệ thống dịch máy của riêng mình

Trình dịch Firefox

Mozilla đã phát hành như một phần của dự án Bergamot, sự ra mắt của một hệ thống dịch máy dựa trên trình duyệt, một cái gì đó tương tự như trình dịch của Chrome, nhưng với sự khác biệt đó sẽ là tùy chọn để dịch các trang web trong Firefox nó sẽ hoạt động mà không cần kết nối internet.

Sự ra mắt của dự án này sẽ cho phép một công cụ dịch trang độc lập được tích hợp vào Firefox không truy cập các dịch vụ đám mây bên ngoài và xử lý dữ liệu độc quyền trên hệ thống của người dùng. Mục tiêu chính của việc phát triển dự án này là đảm bảo tính bảo mật và bảo vệ dữ liệu người dùng khỏi bị rò rỉ khi dịch nội dung của các trang được mở trong trình duyệt.

Bergamot đang được phát triển tại trụ sở của Mozilla ở Berlin với sự tham gia của các nhà nghiên cứu từ nhiều trường đại học khác nhau ở Anh, Estonia và Cộng hòa Séc. Sự phát triển được tài trợ bởi Liên minh Châu Âu như một phần của khoản tài trợ nhận được trong chương trình Horizon 2020.

Số tiền hỗ trợ này là khoảng ba triệu euro. Dự án được thiết kế trong ba năm. Mozilla đã mở một công việc như một chuyên gia về hệ thống học máy để tham gia vào việc phát triển một công cụ dịch từ ngôn ngữ này sang ngôn ngữ khác.

Trong số những phát triển liên quan đến dự án Bergamot, những điều sau được đề cập:

  • Đại học Edinburgh hoạt động trên sự phát triển của Khung dịch máy Marian, được xây dựng trên cơ sở mạng nơ-ron tuần hoàn. Khung được viết bằng C ++ và có thể sử dụng GPU để tăng tốc độ học và dịch. Dự án có giấy phép MIT.
  • Công cụ Neural Monkey được phát triển tại Đại học Praha để xử lý thông tin ngôn ngữ tự nhiên bằng phương pháp máy học tuần tự. Dự án sử dụng khung TensorFlow và nó có thể được sử dụng để tạo mẫu hệ thống dịch máy và phân loại thông tin bằng ngôn ngữ tự nhiên. Mã có sẵn theo giấy phép BSD.
  • Dự án QuEst ++, được phát triển tại Đại học Sheffield, được sử dụng để đánh giá và dự đoán chất lượng của hệ thống dịch máy.
  • Mozilla đang phát triển trên bộ tổng hợp giọng nói (TTS) và công cụ nhận dạng giọng nói (Deep Speech)
  • Dự án ParaCrawl, được tài trợ bởi Liên minh Châu Âu, trong đó tích lũy cơ sở dữ liệu gồm các bản dịch đồng thời của một số cụm từ trong các ngôn ngữ khác nhau, có thể được sử dụng để tạo thành hệ thống học máy.
  • Cơ sở của dự án là Bitxtor, là một bot, lập chỉ mục các trang web đa ngôn ngữ và tự động tìm các văn bản giống nhau được trình bày bằng một số ngôn ngữ. Cơ sở dữ liệu mẫu dịch song song được tạo thành từ 24 ngôn ngữ.

Như trong video demo, một nút mới sẽ xuất hiện trong Firefox, khi người dùng nhấp vào nút này bạn có thể chọn ngôn ngữ mà bạn muốn dịch. Bên cạnh nó sẽ được đặt một nút để quay lại ngôn ngữ gốc.

Các nhà phát triển nói rằng hệ thống cục bộ mới sẽ cung cấp quyền riêng tư và bảo vệ dữ liệu tốt hơn cho người dùng bằng cách dịch nội dung trang trong trình duyệt.

Một vài năm trước, Mozilla đã cố gắng thêm một tính năng dịch thuật tương tự như Google Chrome trong trình duyệt của bạn, nhưng đã từ bỏ nó do chi phí hỗ trợ quá cao.

Firefox có một tính năng tích hợp để dịch các trang, nhưng nó được liên kết với việc sử dụng các dịch vụ đám mây bên ngoài (tương thích với Google, Yandex và Bing) và nó không được bật theo mặc định. Để kích hoạt chức năng, cần phải vào "về: cấu hình”Và thay đổi cài đặt của«trình duyệt.translation").

Cơ chế dịch cũng hỗ trợ tự động phát hiện ngôn ngữ khi một trang được mở bằng ngôn ngữ không xác định và hiển thị một chỉ báo đặc biệt với đề xuất dịch trang.

Nguyên mẫu của hệ thống dịch đang được phát triển như một phần của dự án Bergamot sử dụng cùng một giao diện để tương tác với người dùng. Hệ thống dịch thuật này có thể được kiểm tra trong Firefox Nightly bằng cách bật cài đặt browser.translation.ui.show y browser.translation.detectLanguagee.


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.