Mozilla już pracuje nad stworzeniem własnego systemu tłumaczenia maszynowego

Tłumacz Firefox

Wydała Mozilla w ramach projektu Bergamot, uruchomienie systemu tłumaczenia maszynowego coś w przeglądarce podobny do tłumacza Chrome, ale z tą różnicą, że będzie to opcja tłumaczenia stron internetowych w przeglądarce Firefox będzie działać bez połączenia z Internetem.

Uruchomienie tego projektu pozwoli na zintegrowanie samodzielnego silnika tłumaczenia stron z przeglądarką Firefox brak dostępu do zewnętrznych usług w chmurze oraz przetwarza dane wyłącznie w systemie użytkownika. Głównym celem rozwoju tego projektu jest zagwarantowanie poufności i ochrona danych użytkownika przed ewentualnymi wyciekami podczas tłumaczenia zawartości stron otwieranych w przeglądarce.

Bergamot powstaje w siedzibie Mozilli w Berlinie przy udziale naukowców z różnych uczelni w Wielkiej Brytanii, Estonii i Czechach. Rozwój jest finansowany przez Unię Europejską w ramach grantu otrzymanego w ramach programu Horyzont 2020.

Kwota tego wsparcia wynosi około trzech milionów euro. Projekt przeznaczony jest na trzy lata. Mozilla otworzyła pracę jako specjalista w systemach uczenia maszynowego, aby uczestniczyć w rozwoju silnika do tłumaczenia z jednego języka na inny.

Z wydarzeń związanych z projektem Bergamot, wspomina się o następujących kwestiach:

  • Uniwersytet w Edynburgu pracuje nad rozwój Mariańskie ramy tłumaczenia maszynowego, która jest zbudowana w oparciu o cykliczną sieć neuronową. Framework jest napisany w C ++ i może korzystać z GPU w celu przyspieszenia nauki i tłumaczenia. Projekt objęty jest licencją MIT.
  • Narzędzie Neural Monkey opracowany na Uniwersytecie w Pradze przetwarzanie informacji w języku naturalnym przy użyciu sekwencyjnych metod uczenia maszynowego. Projekt korzysta ze struktury TensorFlow i może być używany do prototypowania systemów tłumaczenia maszynowego i klasyfikowania informacji w języku naturalnym. Kod jest dostępny na licencji BSD.
  • Projekt QuEst ++, który jest rozwijany na Uniwersytecie w Sheffield, służy do oceny i przewidywania jakości systemów tłumaczenia maszynowego.
  • Mozilla rozwija syntezator mowy (TTS) i silnik rozpoznawania mowy (Deep Speech)
  • Projekt ParaCrawl, finansowana przez Unię Europejską, który gromadzi bazę danych tłumaczeń symultanicznych kilku fraz w różnych językach, które można wykorzystać do stworzenia systemów uczenia maszynowego.
  • Podstawą projektu jest bitextor, czyli bot, który indeksuje wielojęzyczne strony internetowe i automatycznie wyszukuje te same teksty prezentowane w kilku językach. Baza przykładów tłumaczeń równoległych składa się z 24 języków.

Jak pokazano na filmie demonstracyjnym, w przeglądarce Firefox pojawi się nowy przycisk, gdy użytkownik kliknie ten przycisk możesz wybrać język, na który chcesz tłumaczyć. Obok zostanie umieszczony przycisk powrotu do oryginalnego języka.

Twórcy twierdzą, że nowy system lokalny zapewni użytkownikom lepszą prywatność i ochronę danych, tłumacząc zawartość strony w przeglądarce.

Kilka lat temu Mozilla próbowała już dodać funkcję tłumaczenia podobny do Google Chrome w Twojej przeglądarce, ale porzucił go ze względu na koszty wsparcie zbyt wysokie.

Firefox ma wbudowaną funkcję do tłumaczenia stron, ale wiąże się to z korzystaniem z zewnętrznych usług w chmurze (kompatybilny z Google, Yandex i Bing) i nie jest włączona domyślnie. Aby aktywować funkcję, należy przejść do "about: config„I zmień ustawienia«przeglądarka.tłumaczenie").

Mechanizm tłumaczenia obsługuje również automatyczne wykrywanie języka, gdy strona jest otwierana w nieznanym języku i wyświetla specjalny wskaźnik z propozycją przetłumaczenia strony.

Prototyp systemu tłumaczeniowego, który powstaje w ramach projektu Bergamot używa tego samego interfejsu do interakcji z użytkownikiem. Ten system tłumaczenia można przetestować w Firefoksie Nightly, włączając ustawienia przeglądarka.tłumaczenie.ui.show y browser.translation.detectJęzyke.


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Miguel Ángel Gatón
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.