Mozilla jobber allerede med å utvikle sitt eget maskinoversettelsessystem

Firefox-oversetter

Mozilla har gitt ut som en del av Bergamot-prosjektet, lanseringen av et maskinoversettelsessystem nettleserbasert, noe ligner på Chrome-oversetteren, men med forskjellen det vil være at muligheten til å oversette websider i Firefox det fungerer uten internettforbindelse.

Lanseringen av dette prosjektet vil tillate å integrere en frittstående oversettelsesmotor i Firefox ikke får tilgang til eksterne skytjenester og behandler data utelukkende på brukerens system. Hovedmålet med utviklingen av dette prosjektet er å garantere konfidensialitet og beskytte brukerdata mot mulige lekkasjer ved oversettelse av innholdet på sidene som er åpnet i nettleseren.

Bergamot utvikles ved Mozillas hovedkvarter i Berlin med deltakelse av forskere fra forskjellige universiteter i Storbritannia, Estland og Tsjekkia. Utviklingen er finansiert av EU som en del av et tilskudd mottatt under Horizon 2020-programmet.

Beløpet for denne støtten er rundt tre millioner euro. Prosjektet er designet i tre år. Mozilla har åpnet en jobb som spesialist innen maskinlæringssystemer for å delta i utviklingen av en motor for oversettelse fra ett språk til et annet.

Av utviklingen knyttet til Bergamot-prosjektet, følgende er nevnt:

  • University of Edinburgh jobber med utviklingen av Marian rammeverk for maskinoversettelse, som er bygget på grunnlag av et tilbakevendende nevrale nettverk. Rammeverket er skrevet i C ++, og kan bruke GPU for å øke hastigheten på læring og oversettelse. Prosjektet kommer under MIT-lisensen.
  • Verktøyet Neural Monkey utviklet seg ved universitetet i Praha å behandle informasjon om naturlig språk ved hjelp av sekvensielle maskinlæringsmetoder. Prosjektet bruker TensorFlow-rammeverket og den kan brukes til å prototype maskinoversettingssystemer og klassifisere informasjon på naturlig språk. Koden er tilgjengelig under BSD-lisensen.
  • QuEst ++ -prosjektet, som er utviklet ved University of Sheffield, brukes til å evaluere og forutsi kvaliteten på maskinoversettelsessystemer.
  • Mozilla utvikler en talesyntetiser (TTS) og talegjenkjenningsmotor (Deep Speech)
  • Prosjektet ParaCrawl, finansiert av EU, som samler en database med samtidige oversettelser av flere setninger på forskjellige språk, som kan brukes til å danne maskinlæringssystemer.
  • Grunnlaget for prosjektet er bitextor, som er en bot, som indekserer flerspråklige nettsteder og automatisk finner de samme tekstene presentert på flere språk. Den parallelle oversettelseseksempelbasen består av 24 språk.

Som vist i demovideoen, en ny knapp vises i Firefox, når brukeren klikker på denne knappen du kan velge språket du vil oversette til. Ved siden av vil det være en knapp for å gå tilbake til originalspråket.

Utviklerne sier at det nye lokale systemet vil gi bedre personvern og databeskyttelse for brukere ved å oversette sideinnhold i nettleseren.

For noen år siden prøvde Mozilla allerede å legge til en oversettelsesfunksjon ligner på Google Chrome i nettleseren din, men forlot det på grunn av kostnader støtte for høyt.

Firefox har en innebygd funksjon å oversette sider, men det er knyttet til bruk av eksterne skytjenester (kompatibel med Google, Yandex og Bing) og det er ikke aktivert som standard. For å aktivere funksjonen er det nødvendig å gå til "om: config”Og endre innstillingene til«nettleser. oversettelse").

Oversettelsesmekanismen støtter også automatisk språkoppdagelse når en side åpnes på et ukjent språk og viser en spesiell indikator med et forslag om å oversette siden.

Prototypen til oversettelsessystemet som utvikles som en del av prosjektet Bergamot bruker samme grensesnitt for å samhandle med brukeren. Dette oversettelsessystemet kan testes i Firefox Nightly ved å aktivere innstillingene browser.translation.ui.show y browser.translation.detectLanguagee.


Legg igjen kommentaren

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Kontroller SPAM, kommentaradministrasjon.
  3. Legitimering: Ditt samtykke
  4. Kommunikasjon av dataene: Dataene vil ikke bli kommunisert til tredjeparter bortsett fra ved juridisk forpliktelse.
  5. Datalagring: Database vert for Occentus Networks (EU)
  6. Rettigheter: Når som helst kan du begrense, gjenopprette og slette informasjonen din.