Mozilla arbejder allerede på at udvikle sit eget maskinoversættelsessystem

Firefox-oversætter

Mozilla har frigivet som en del af Bergamot-projektet, lanceringen af ​​et maskinoversættelsessystem browser-baseret, noget svarer til Chrome's oversætter, men med forskellen det vil være, at muligheden for at oversætte websider i Firefox det fungerer uden internetforbindelse.

Lanceringen af ​​dette projekt gør det muligt at integrere en enkeltstående oversættelsesmaskine til sider i Firefox ikke adgang til eksterne skytjenester og behandler data udelukkende på brugerens system. Hovedformålet med udviklingen af ​​dette projekt er at garantere fortrolighed og beskytte brugerdata mod mulige lækager ved oversættelse af indholdet af de sider, der er åbnet i browseren.

Bergamot udvikles i Mozillas hovedkvarter i Berlin med deltagelse af forskere fra forskellige universiteter i Storbritannien, Estland og Tjekkiet. Udviklingen er finansieret af Den Europæiske Union som en del af et tilskud modtaget under Horizon 2020-programmet.

Støtten er omkring tre millioner euro. Projektet er designet i tre år. Mozilla har åbnet et job som specialist i maskinlæringssystemer for at deltage i udviklingen af ​​en motor til oversættelse fra et sprog til et andet.

Af udviklingen relateret til Bergamot-projektet følgende er nævnt:

  • University of Edinburgh arbejder på udviklingen af Marian ramme for maskinoversættelse, som er bygget på basis af et tilbagevendende neuralt netværk. Rammen er skrevet i C ++ og kan bruge GPU'en til at fremskynde læring og oversættelse. Projektet hører under MIT-licensen.
  • Værktøjet Neural Monkey udviklet ved universitetet i Prag at behandle information om naturligt sprog ved hjælp af sekventielle maskinlæringsmetoder. Projektet bruger TensorFlow-rammen og det kan bruges til at prototype maskineoversættelsessystemer og klassificere information på naturligt sprog. Koden er tilgængelig under BSD-licensen.
  • QuEst ++ -projektet, der er udviklet ved University of Sheffield, bruges til at evaluere og forudsige kvaliteten af ​​maskinoversættelsessystemer.
  • Mozilla udvikler en tale-synthesizer (TTS) og talegenkendelsesmotor (Deep Speech)
  • Projektet ParaCrawl, finansieret af Den Europæiske Union, som akkumulerer en database med samtidige oversættelser af flere sætninger på forskellige sprog, som kan bruges til at danne maskinlæringssystemer.
  • Grundlaget for projektet er bitextor, som er en bot, der indekserer flersprogede websteder og automatisk finder de samme tekster præsenteret på flere sprog. Den parallelle oversættelseseksempeldatabase består af 24 sprog.

Som vist i demo-videoen, en ny knap vises i Firefox, når brugeren klikker på denne knap du kan vælge det sprog, du vil oversætte til. Ved siden af ​​den placeres en knap for at vende tilbage til det originale sprog.

Udviklerne siger, at det nye lokale system giver brugerne bedre privatliv og databeskyttelse ved at oversætte sideindhold i browseren.

For et par år siden forsøgte Mozilla allerede at tilføje en oversættelsesfunktion svarer til Google Chrome i din browser, men opgav det på grund af omkostninger støtte for højt.

Firefox har en indbygget funktion at oversætte sider, men det er knyttet til brugen af ​​eksterne skytjenester (kompatibel med Google, Yandex og Bing) og det er ikke aktiveret som standard. For at aktivere funktionen er det nødvendigt at gå til "om: config”Og skift indstillingerne for«browser.oversættelse").

Oversættelsesmekanismen understøtter også automatisk sprogregistrering, når en side åbnes på et ukendt sprog og viser en særlig indikator med et forslag om at oversætte siden.

Prototypen på oversættelsessystemet, der udvikles som en del af projektet Bergamot bruger den samme grænseflade til at interagere med brugeren. Dette oversættelsessystem kan testes i Firefox Nightly ved at aktivere indstillingerne browser.translation.ui.show y browser.translation.detectLanguagee.


Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.