Mozilla už pracuje na vývoji vlastného systému strojového prekladu

Prekladač Firefoxu

Mozilla vydala v rámci projektu Bergamot, spustenie systému strojového prekladu založené na prehliadači, niečo podobne ako prekladač Chrome, ale s tým rozdielom bude možnosť prekladu webových stránok vo Firefoxe bude to fungovať bez pripojenia na internet.

Spustenie tohto projektu umožní integráciu samostatného nástroja na preklad stránok do prehliadača Firefox nemá prístup k externým cloudovým službám a spracúva údaje výhradne v systéme používateľa. Hlavným cieľom vývoja tohto projektu je zaručiť dôvernosť a chrániť údaje používateľov pred možnými únikmi pri preklade obsahu stránok otvorených v prehliadači.

Bergamot sa vyvíja v berlínskej centrále Mozilly za účasti výskumných pracovníkov z rôznych univerzít vo Veľkej Británii, Estónsku a Českej republike. Vývoj je financovaný z prostriedkov Európskej únie ako súčasť grantu získaného v rámci programu Horizont 2020.

Výška tejto podpory sa pohybuje okolo troch miliónov eur. Projekt je navrhnutý na tri roky. Mozilla si otvorila miesto špecialistu na systémy strojového učenia s cieľom podieľať sa na vývoji nástroja na preklad z jedného jazyka do druhého.

Z vývoja súvisiaceho s projektom Bergamot, uvádzajú sa tieto:

  • University of Edinburgh pracuje ďalej vývoj Mariánsky rámec strojového prekladu, ktorá je postavená na báze rekurentnej neurónovej siete. Rámec je napísaný v jazyku C ++ a môže na urýchlenie učenia a prekladu využiť GPU. Projekt spadá pod licenciu MIT.
  • Nástroj Neural Monkey vyvinutý na pražskej univerzite spracovávať informácie v prirodzenom jazyku pomocou metód postupného strojového učenia. Projekt používa rámec TensorFlow a možno ho použiť na prototypovanie systémov strojového prekladu a klasifikáciu informácií v prirodzenom jazyku. Tento kód je k dispozícii v rámci licencie BSD.
  • Projekt QuEst ++, ktorý je vyvinutý na univerzite v Sheffielde, sa používa na hodnotenie a predikciu kvality systémov strojového prekladu.
  • Mozilla vyvíja syntetizátor reči (TTS) a modul rozpoznávania reči (Deep Speech)
  • Projekt ParaCrawl, financovaný Európskou úniou, ktorá zhromažďuje databázu simultánnych prekladov niekoľkých fráz v rôznych jazykoch, z ktorej je možné vytvoriť systémy strojového učenia.
  • Základom projektu je bitextor, čo je robot, ktorý indexuje viacjazyčné webové stránky a automaticky vyhľadáva rovnaké texty prezentované vo viacerých jazykoch. Vzorová databáza paralelného prekladu sa skladá z 24 jazykov.

Ako je uvedené v ukážkovom videu, vo Firefoxe sa zobrazí nové tlačidlo, keď používateľ klikne na toto tlačidlo môžete zvoliť jazyk, do ktorého chcete preložiť. Vedľa neho bude tlačidlo pre návrat do pôvodného jazyka.

Vývojári tvrdia, že nový lokálny systém poskytne používateľom lepšiu ochranu súkromia a údajov prostredníctvom prekladu obsahu stránky v prehliadači.

Pred niekoľkými rokmi sa už Mozilla pokúšala pridať funkciu prekladu podobné prehliadaču Google Chrome vo vašom prehliadači, ale opustil ho kvôli nákladom podpora príliš vysoká.

Firefox má zabudovanú funkciu prekladať stránky, ale súvisí to s využívaním externých cloudových služieb (kompatibilné s Google, Yandex a Bing) a nie je predvolene povolená. Pre aktiváciu funkcie je potrebné prejsť na „o: konfigur”A zmeňte nastavenie«prehliadač.preklad").

Mechanizmus prekladu tiež podporuje automatickú detekciu jazyka pri otvorení stránky v neznámom jazyku a zobrazuje špeciálny indikátor s návrhom na preloženie stránky.

Prototyp prekladateľského systému, ktorý sa vyvíja v rámci projektu Bergamot používa rovnaké rozhranie na interakciu s používateľom. Tento prekladový systém je možné otestovať vo Firefoxe Nightly povolením nastavení prehliadač.translation.ui.show y browser.translation.detectLanguagee.


Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Zodpovedný za údaje: Miguel Ángel Gatón
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.