Mozilla уже работает над разработкой собственной системы машинного перевода.

Переводчик Firefox

Mozilla выпустила в рамках проекта Bergamot, запуск системы машинного перевода на основе браузера, что-то похож на переводчик Chrome, но с той разницей, что будет возможность переводить веб-страницы в Firefox он будет работать без подключения к Интернету.

Запуск этого проекта позволит интегрировать автономный движок перевода страниц в Firefox отсутствие доступа к внешним облачным сервисам и обрабатывает данные исключительно в системе пользователя. Основная цель разработки этого проекта - гарантировать конфиденциальность и защитить данные пользователей от возможных утечек при переводе содержимого страниц, открытых в браузере.

Бергамот разрабатывается в штаб-квартире Mozilla в Берлине. с участием исследователей из различных университетов Великобритании, Эстонии и Чехии. Разработка финансируется Европейским Союзом. в рамках гранта, полученного по программе Horizon 2020.

Размер этой поддержки составляет около трех миллионов евро. Проект рассчитан на три года. Mozilla открыла вакансию специалиста по системам машинного обучения, чтобы участвовать в разработке движка для перевода с одного языка на другой.

Из событий, связанных с проектом Бергамот, упоминаются следующие:

  • Эдинбургский университет работает над развитие Фреймворк машинного перевода Marian, построенный на основе рекуррентной нейронной сети. Фреймворк написан на C ++ и может использовать графический процессор для ускорения обучения и перевода. Проект распространяется под лицензией MIT.
  • Инструмент Neural Monkey, разработанная в Пражском университете для обработки информации на естественном языке с помощью методов последовательного машинного обучения. Проэкт использует фреймворк TensorFlow и его можно использовать для создания прототипов систем машинного перевода и классификации информации на естественном языке. Код доступен по лицензии BSD.
  • Проект QuEst ++, который разрабатывается в Университете Шеффилда., используется для оценки и прогнозирования качества систем машинного перевода.
  • Mozilla разрабатывает синтезатор речи (TTS) и движок распознавания речи (Deep Speech).
  • В рамках проекта ParaCrawl, финансируемый Европейским Союзом, в котором накапливается база данных одновременных переводов нескольких фраз на разные языки, из которых можно формировать системы машинного обучения.
  • Основа проекта - bitextor - бот, который индексирует многоязычные сайты и автоматически находит одинаковые тексты, представленные на нескольких языках. База данных примеров параллельного перевода состоит из 24 языков.

Как показано в демонстрационном видео, в Firefox появится новая кнопка, когда пользователь нажимает на эту кнопку вы можете выбрать язык, на который хотите перевести. Рядом с ним будет размещена кнопка для возврата к исходному языку.

Разработчики заявляют, что новая локальная система обеспечит лучшую конфиденциальность и защиту данных для пользователей за счет перевода содержимого страницы в браузере.

Несколько лет назад Mozilla уже пыталась добавить функцию перевода аналогично Google Chrome в вашем браузере, но отказались от него из-за затрат поддержка слишком высока.

Firefox имеет встроенную функцию переводить страницы, но это связано с использованием внешних облачных сервисов (совместим с Google, Яндекс и Bing) и по умолчанию он не включен. Для активации функции необходимо перейти в "о: конфиг»И измените настройки«браузер.перевод«).

Механизм перевода также поддерживает автоматическое определение языка при открытии страницы на неизвестном языке и отображает специальный индикатор с предложением перевести страницу.

Прототип системы перевода, разрабатываемой в рамках проекта. Бергамот использует тот же интерфейс для взаимодействия с пользователем. Эта система перевода можно протестировать в Firefox Nightly, включив настройки browser.translation.ui.show y browser.translation.detectLanguagee.


Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: Мигель Анхель Гатон
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.