Mozilla выпустила в рамках проекта Bergamot, запуск системы машинного перевода на основе браузера, что-то похож на переводчик Chrome, но с той разницей, что будет возможность переводить веб-страницы в Firefox он будет работать без подключения к Интернету.
Запуск этого проекта позволит интегрировать автономный движок перевода страниц в Firefox отсутствие доступа к внешним облачным сервисам и обрабатывает данные исключительно в системе пользователя. Основная цель разработки этого проекта - гарантировать конфиденциальность и защитить данные пользователей от возможных утечек при переводе содержимого страниц, открытых в браузере.
Бергамот разрабатывается в штаб-квартире Mozilla в Берлине. с участием исследователей из различных университетов Великобритании, Эстонии и Чехии. Разработка финансируется Европейским Союзом. в рамках гранта, полученного по программе Horizon 2020.
Размер этой поддержки составляет около трех миллионов евро. Проект рассчитан на три года. Mozilla открыла вакансию специалиста по системам машинного обучения, чтобы участвовать в разработке движка для перевода с одного языка на другой.
Из событий, связанных с проектом Бергамот, упоминаются следующие:
- Эдинбургский университет работает над развитие Фреймворк машинного перевода Marian, построенный на основе рекуррентной нейронной сети. Фреймворк написан на C ++ и может использовать графический процессор для ускорения обучения и перевода. Проект распространяется под лицензией MIT.
- Инструмент Neural Monkey, разработанная в Пражском университете для обработки информации на естественном языке с помощью методов последовательного машинного обучения. Проэкт использует фреймворк TensorFlow и его можно использовать для создания прототипов систем машинного перевода и классификации информации на естественном языке. Код доступен по лицензии BSD.
- Проект QuEst ++, который разрабатывается в Университете Шеффилда., используется для оценки и прогнозирования качества систем машинного перевода.
- Mozilla разрабатывает синтезатор речи (TTS) и движок распознавания речи (Deep Speech).
- В рамках проекта ParaCrawl, финансируемый Европейским Союзом, в котором накапливается база данных одновременных переводов нескольких фраз на разные языки, из которых можно формировать системы машинного обучения.
- Основа проекта - bitextor - бот, который индексирует многоязычные сайты и автоматически находит одинаковые тексты, представленные на нескольких языках. База данных примеров параллельного перевода состоит из 24 языков.
Как показано в демонстрационном видео, в Firefox появится новая кнопка, когда пользователь нажимает на эту кнопку вы можете выбрать язык, на который хотите перевести. Рядом с ним будет размещена кнопка для возврата к исходному языку.
Разработчики заявляют, что новая локальная система обеспечит лучшую конфиденциальность и защиту данных для пользователей за счет перевода содержимого страницы в браузере.
Несколько лет назад Mozilla уже пыталась добавить функцию перевода аналогично Google Chrome в вашем браузере, но отказались от него из-за затрат поддержка слишком высока.
Firefox имеет встроенную функцию переводить страницы, но это связано с использованием внешних облачных сервисов (совместим с Google, Яндекс и Bing) и по умолчанию он не включен. Для активации функции необходимо перейти в "о: конфиг»И измените настройки«браузер.перевод«).
Механизм перевода также поддерживает автоматическое определение языка при открытии страницы на неизвестном языке и отображает специальный индикатор с предложением перевести страницу.
Прототип системы перевода, разрабатываемой в рамках проекта. Бергамот использует тот же интерфейс для взаимодействия с пользователем. Эта система перевода можно протестировать в Firefox Nightly, включив настройки browser.translation.ui.show y browser.translation.detectLanguagee.