„Mozilla“ jau dirba kurdama savo mašininio vertimo sistemą

„Firefox“ vertėjas

„Mozilla“ išleido kaip „Bergamot“ projekto dalis, mašininio vertimo sistemos paleidimas naršyklė, kažkas panašus į „Chrome“ vertėją, bet tuo skirtumu bus tokia galimybė versti tinklalapius „Firefox“ jis veiks be interneto ryšio.

Šio projekto pradžia leis į „Firefox“ integruoti atskirą puslapio vertimo variklį nesinaudojant išorinėmis debesų paslaugomis ir apdoroja duomenis tik vartotojo sistemoje. Pagrindinis šio projekto vystymo tikslas yra garantuoti konfidencialumą ir apsaugoti vartotojo duomenis nuo galimų nutekėjimų verčiant naršyklėje atidarytų puslapių turinį.

Bergamotė kuriama „Mozilla“ būstinėje Berlyne dalyvaujant mokslininkams iš įvairių JK, Estijos ir Čekijos universitetų. Plėtrą finansuoja Europos Sąjunga pagal programą „Horizontas 2020“ gautą dotaciją.

Šios paramos suma siekia apie tris milijonus eurų. Projektas skirtas trejiems metams. „Mozilla“ pradėjo dirbti mašininio mokymosi sistemų specialiste, kad galėtų dalyvauti kuriant vertimo iš vienos kalbos į kitą variklį.

Iš įvykių, susijusių su „Bergamot“ projektu, minimi:

  • Dirba Edinburgo universitetas plėtra „Marian“ mašininio vertimo sistema, kuris pastatytas pasikartojančio neuroninio tinklo pagrindu. Struktūra parašyta C ++ kalba ir gali naudoti GPU, kad paspartintų mokymąsi ir vertimą. Projektas turi MIT licenciją.
  • Priemonė „Neural Monkey“ sukurta Prahos universitete apdoroti natūralios kalbos informaciją, naudojant nuoseklius mašininio mokymosi metodus. Projektas naudoja „TensorFlow“ sistemą ir jis gali būti naudojamas mašininio vertimo sistemų prototipams kurti ir informacijai klasifikuoti natūralia kalba. Kodas prieinamas pagal BSD licenciją.
  • „QuEst ++“ projektas, sukurtas Šefildo universitete, naudojamas įvertinti ir numatyti mašininio vertimo sistemų kokybę.
  • „Mozilla“ kuria kalbos sintezatorių (TTS) ir kalbos atpažinimo variklį („Deep Speech“)
  • El proyecto „ParaCrawl“, finansuojamas Europos Sąjungos, kuriame kaupiama kelių frazių sinchroninio vertimo skirtingomis kalbomis duomenų bazė, kuri gali būti naudojama formuojant mašininio mokymosi sistemas.
  • Projekto pagrindas yra „bitextor“, kuris yra robotas, kuris indeksuoja daugiakalbes svetaines ir automatiškai randa tuos pačius tekstus, pateiktus keliomis kalbomis. Lygiagretaus vertimo pavyzdžių bazę sudaro 24 kalbos.

Kaip parodyta demonstraciniame vaizdo įraše, „Firefox“ pasirodys naujas mygtukas, kai vartotojas spusteli šį mygtuką galite pasirinkti kalbą, į kurią norite išversti. Šalia bus įdėtas mygtukas, norint grįžti į originalo kalbą.

Kūrėjai teigia, kad naujoji vietinė sistema vartotojams užtikrins geresnį privatumą ir duomenų apsaugą, išverčiant puslapio turinį naršyklėje.

Prieš kelerius metus „Mozilla“ jau bandė pridėti vertimo funkciją panaši į „Google Chrome“ jūsų naršyklėje, bet atsisakė dėl išlaidų palaikymas per didelis.

„Firefox“ turi įmontuotą funkciją išversti puslapius, bet tai siejama su išorinių debesijos paslaugų naudojimu (suderinamas su „Google“, „Yandex“ ir „Bing“) ir pagal numatytuosius nustatymus ji neįgalinta. Norint suaktyvinti funkciją, reikia eiti į "apie: konfig„Ir pakeiskite«naršyklė.vertimas").

Vertimo mechanizmas taip pat palaiko automatinį kalbos aptikimą, kai puslapis atidaromas nežinoma kalba, ir rodo specialų indikatorių su pasiūlymu išversti puslapį.

Vertimo sistemos, kuri yra kuriama kaip projekto dalis, prototipas „Bergamot“ naudoja tą pačią sąsają, kad galėtų bendrauti su vartotoju. Ši vertimo sistema galima išbandyti „Firefox Nightly“ įgalinant nustatymus browser.translation.ui.show y browser.translation.detectLanguagee.


Palikite komentarą

Jūsų elektroninio pašto adresas nebus skelbiamas. Privalomi laukai yra pažymėti *

*

*

  1. Atsakingas už duomenis: Miguel Ángel Gatón
  2. Duomenų paskirtis: kontroliuoti šlamštą, komentarų valdymą.
  3. Įteisinimas: jūsų sutikimas
  4. Duomenų perdavimas: Duomenys nebus perduoti trečiosioms šalims, išskyrus teisinius įsipareigojimus.
  5. Duomenų saugojimas: „Occentus Networks“ (ES) talpinama duomenų bazė
  6. Teisės: bet kuriuo metu galite apriboti, atkurti ir ištrinti savo informaciją.