Mozilla вже працює над розробкою власної системи машинного перекладу

Перекладач Firefox

Mozilla випустила в рамках проекту Бергамот, запуск системи машинного перекладу на основі браузера, щось схожий на перекладач Chrome, але з тією різницею, що буде можливість перекладу веб-сторінок у Firefox він буде працювати без підключення до Інтернету.

Запуск цього проекту дозволить інтегрувати автономний механізм перекладу сторінок у Firefox відсутність доступу до зовнішніх хмарних служб і обробляє дані виключно в системі користувача. Основною метою розробки цього проекту є гарантування конфіденційності та захист даних користувача від можливих витоків при перекладі вмісту сторінок, відкритих у браузері.

Бергамот розробляється в штаб-квартирі Mozilla в Берліні за участю дослідників з різних університетів Великобританії, Естонії та Чехії. Розробка фінансується Європейським Союзом в рамках гранту, отриманого за програмою «Горизонт 2020».

Сума цієї підтримки становить близько трьох мільйонів євро. Проект розрахований на три роки. Mozilla відкрила роботу спеціаліста з систем машинного навчання для участі у розробці механізму перекладу з однієї мови на іншу.

З розробок, пов'язаних з проектом Бергамот, згадуються такі:

  • Едінбурзький університет працює над розвиток Маріанська система машинного перекладу, який побудований на основі періодичної нейронної мережі. Фреймворк написаний на C ++ і може використовувати графічний процесор для пришвидшення навчання та перекладу. Проект має ліцензію MIT.
  • Інструмент Нейронна мавпа, розроблена в Празькому університеті обробляти інформацію на природній мові за допомогою послідовних методів машинного навчання. Проект використовує фреймворк TensorFlow і його можна використовувати для створення прототипу систем машинного перекладу та класифікації інформації природною мовою. Код доступний за ліцензією BSD.
  • Проект QuEst ++, який розроблений в Університеті Шеффілда, використовується для оцінки та прогнозування якості систем машинного перекладу.
  • Mozilla розробляє синтезатор мови (TTS) та механізм розпізнавання мови (Deep Speech)
  • Проект ParaCrawl, що фінансується Європейським Союзом, яка накопичує базу даних одночасних перекладів декількох фраз різними мовами, яка може бути використана для формування систем машинного навчання.
  • Основою проекту є bitextor, який є ботом, який індексує багатомовні веб-сайти та автоматично знаходить ті самі тексти, представлені кількома мовами. Зразок бази даних паралельного перекладу складається з 24 мов.

Як показано в демонстраційному відео, у Firefox з’явиться нова кнопка, коли користувач натискає на цю кнопку Ви можете вибрати мову, на яку ви хочете перекласти. Поруч з ним буде розміщена кнопка повернення до мови оригіналу.

Розробники заявляють, що нова локальна система забезпечить кращу конфіденційність та захист даних для користувачів, перекладаючи вміст сторінки в браузері.

Кілька років тому Mozilla вже намагалася додати функцію перекладу схожий на Google Chrome у вашому браузері, але відмовився від нього через витрати підтримка занадто висока.

Firefox має вбудовану функцію перекладати сторінки, але це пов’язано з використанням зовнішніх хмарних служб (сумісний з Google, Яндекс та Bing) та це не ввімкнено за замовчуванням. Для активації функції необхідно перейти до "about: конфігурація”І змінити налаштування«браузер. переклад«).

Механізм перекладу також підтримує автоматичне визначення мови, коли сторінка відкривається невідомою мовою, і відображає спеціальний індикатор із пропозицією перекласти сторінку.

Прототип системи перекладу, що розробляється в рамках проекту Бергамот використовує той самий інтерфейс для взаємодії з користувачем. Ця система перекладу можна перевірити у Firefox Nightly, увімкнувши налаштування browser.translation.ui.show y browser.translation.detectLanguagee.


Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: Мігель Анхель Гатон
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.