Mozilla töötab juba oma masintõlkesüsteemi väljatöötamise kallal

Firefoxi tõlk

Mozilla on välja andnud Bergamoti projekti raames masintõlkesüsteemi käivitamine brauseripõhine, midagi sarnane Chrome'i tõlkijaga, kuid selle erinevusega on see võimalus Firefoxi veebilehtede tõlkimiseks see töötab ilma Interneti-ühenduseta.

Selle projekti käivitamine võimaldab integreerida Firefoxi iseseisva lehe tõlkemootori välistele pilveteenustele mitte juurdepääsu ja töötleb andmeid ainult kasutaja süsteemis. Selle projekti arendamise peamine eesmärk on tagada konfidentsiaalsus ja kaitsta kasutajaandmeid võimalike lekete eest brauseris avatud lehtede sisu tõlkimisel.

Bergamotti arendatakse Mozilla peakorteris Berliinis Suurbritannia, Eesti ja Tšehhi Vabariigi erinevate ülikoolide teadlaste osavõtul. Arendust rahastab Euroopa Liit programmi Horisont 2020 raames saadud toetuse osana.

Selle toetuse suurus on umbes kolm miljonit eurot. Projekt on kavandatud kolmeks aastaks. Mozilla on avanud töö masinõppesüsteemide spetsialistina, et osaleda ühest keelest teise tõlkimise mootori väljatöötamisel.

Bergamoti projektiga seotud arengutest mainitakse järgmisi:

  • Edinburghi ülikool töötab edasi areng Mariani masintõlke raamistik, mis on üles ehitatud korduva närvivõrgu baasil. Raamistik on kirjutatud C ++ keeles ja saab õppimise ja tõlkimise kiirendamiseks kasutada GPU-d. Projekt kuulub MIT-i litsentsi alla.
  • Tööriist Neural Monkey töötati välja Praha ülikoolis loomuliku keele teabe töötlemiseks järjestikuste masinõppemeetodite abil. Projekt kasutab TensorFlow raamistikku seda saab kasutada masintõlkesüsteemide prototüüpimiseks ja teabe klassifitseerimiseks loomulikus keeles. Kood on saadaval BSD litsentsi alusel.
  • Sheffieldi ülikoolis välja töötatud projekt QuEst ++, kasutatakse masintõlkesüsteemide kvaliteedi hindamiseks ja ennustamiseks.
  • Mozilla töötab kõnesüntesaatoril (TTS) ja kõnetuvastusmootoril (Deep Speech)
  • El proyecto Euroopa Liidu rahastatud ParaCrawl mis kogub mitme fraasi eri keeltes samaaegse tõlke andmebaasi, mida saab kasutada masinõppesüsteemide moodustamiseks.
  • Projekti aluseks on bitextor, mis on robot, mis indekseerib mitmekeelseid veebisaite ja leiab automaatselt samad tekstid, mida esitatakse mitmes keeles. Paralleelse tõlke näidisandmebaas koosneb 24 keelest.

Nagu demovideos näidatud, ilmub Firefoxis uus nupp, kui kasutaja sellel nupul klõpsab saate valida keele, kuhu soovite tõlkida. Selle kõrval asetatakse algkeele juurde naasmiseks nupp.

Arendajate sõnul pakub uus kohalik süsteem brauseris lehe sisu tõlkimisega kasutajatele paremat privaatsust ja andmekaitset.

Mõni aasta tagasi proovis Mozilla juba tõlkefunktsiooni lisada sarnane teie brauseri Google Chrome'iga, kuid loobus sellest kulude tõttu tugi liiga kõrge.

Firefoxil on sisseehitatud funktsioon lehtede tõlkimiseks, kuid see on seotud väliste pilveteenuste kasutamisega (ühilduvad Google'i, Yandexi ja Bingiga) ja see pole vaikimisi lubatud. Funktsiooni aktiveerimiseks on vaja minna "umbes: konfigJa muutke seadete «brauser.tõlge").

Tõlkemehhanism toetab ka keele automaatset tuvastamist, kui leht avatakse tundmatus keeles, ja kuvab spetsiaalse indikaatori koos ettepanekuga lehe tõlkimiseks.

Projekti raames arendatava tõlkesüsteemi prototüüp Bergamot kasutab kasutajaga suhtlemiseks sama liidest. See tõlkesüsteem saab seadetes lubades testida Firefoxi öösel brauser.translation.ui.show y browser.translation.detectLanguagee.


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutab: Miguel Ángel Gatón
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.