Mozilla вече работи по разработването на собствена система за машинен превод

Преводач на Firefox

Mozilla пусна като част от проекта Бергамот, стартирането на система за машинен превод базиран на браузър, нещо подобно на преводача на Chrome, но с тази разлика ще бъде, че опцията за превод на уеб страници във Firefox ще работи без интернет връзка.

Стартирането на този проект ще позволи самостоятелна машина за превод на страници да бъде интегрирана във Firefox липса на достъп до външни облачни услуги и обработва данни изключително в системата на потребителя. Основната цел на разработката на този проект е да гарантира поверителност и да защити потребителските данни от възможни течове при превод на съдържанието на отворените страници в браузъра.

Бергамотът се разработва в централата на Mozilla в Берлин с участието на изследователи от различни университети във Великобритания, Естония и Чехия. Разработката се финансира от Европейския съюз като част от безвъзмездна помощ, получена по програма „Хоризонт 2020“.

Размерът на тази подкрепа е около три милиона евро. Проектът е проектиран за три години. Mozilla откри работа като специалист по системи за машинно обучение, за да участва в разработването на двигател за превод от един език на друг.

От разработките, свързани с проекта Бергамот, споменават се следните:

  • Университетът в Единбург работи по разработването на Марианска рамка за машинен превод, който е изграден на базата на повтаряща се невронна мрежа. Рамката е написана на C ++ и може да използва GPU за ускоряване на обучението и превода. Проектът е с лиценз MIT.
  • Инструментът Neural Monkey, разработена в Университета в Прага за обработка на информация на естествен език с помощта на последователни методи за машинно обучение. Проектът използва рамката TensorFlow и може да се използва за прототипиране на системи за машинен превод и класифициране на информацията на естествен език. Кодът се предлага под лиценза BSD.
  • Проектът QuEst ++, който е разработен в Университета в Шефилд, се използва за оценка и прогнозиране на качеството на системите за машинен превод.
  • Mozilla се развива върху синтезатор на реч (TTS) и механизъм за разпознаване на реч (Deep Speech)
  • Проектът ParaCrawl, финансиран от Европейския съюз, която натрупва база данни за едновременни преводи на няколко фрази на различни езици, която може да се използва за формиране на системи за машинно обучение.
  • Основата на проекта е bitextor, който е бот, който индексира многоезични уебсайтове и автоматично намира същите текстове, представени на няколко езика. Базата за примери за паралелен превод се състои от 24 езика.

Както е показано в демонстрационното видео, ще се появи нов бутон във Firefox, когато потребителят щракне върху този бутон можете да изберете езика, на който искате да превеждате. До него ще бъде поставен бутон за връщане към оригиналния език.

Разработчиците казват, че новата локална система ще осигури по-добра поверителност и защита на данните за потребителите, като преведе съдържанието на страниците в браузъра.

Преди няколко години Mozilla вече се опитваше да добави функция за превод подобно на Google Chrome във вашия браузър, но го изостави поради разходи подкрепата е твърде висока.

Firefox има вградена функция за превод на страници, но е свързано с използването на външни облачни услуги (съвместим с Google, Yandex и Bing) и не е активиран по подразбиране. За да активирате функцията е необходимо да отидете на "about: конфиг”И променете настройките на«браузър.превод").

Механизмът за превод също така поддържа автоматично откриване на език, когато дадена страница е отворена на непознат език и показва специален индикатор с предложение за превод на страницата.

Прототипът на системата за превод, която се разработва като част от проекта Бергамотът използва същия интерфейс за взаимодействие с потребителя. Тази система за превод може да се тества във Firefox Nightly, като се активират настройките browser.translation.ui.show y browser.translation.detectLanguagee.


Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорен за данните: Мигел Анхел Гатон
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.