Mozilla lucrează deja la dezvoltarea propriului sistem de traducere automată

Traducător Firefox

Mozilla a lansat ca parte a proiectului Bergamot, lansarea unui sistem de traducere automată bazat pe browser, ceva similar traducătorului Chrome, dar cu diferența că va fi acea opțiune de traducere a paginilor web în Firefox va funcționa fără conexiune la internet.

Lansarea acestui proiect va permite integrarea în Firefox a unui motor de traducere de pagină independent neavând acces la servicii cloud externe și prelucrează date exclusiv pe sistemul utilizatorului. Obiectivul principal al dezvoltării acestui proiect este de a garanta confidențialitatea și de a proteja datele utilizatorilor de eventuale scurgeri la traducerea conținutului paginilor deschise în browser.

Bergamota este dezvoltată la sediul Mozilla din Berlin cu participarea cercetătorilor din diferite universități din Marea Britanie, Estonia și Republica Cehă. Dezvoltarea este finanțată de Uniunea Europeană ca parte a unei subvenții primite în cadrul programului Orizont 2020.

Cuantumul acestui sprijin este de aproximativ trei milioane de euro. Proiectul este conceput pentru trei ani. Mozilla a deschis un loc de muncă ca specialist în sisteme de învățare automată pentru a participa la dezvoltarea unui motor pentru traducerea dintr-o limbă în alta.

Dintre evoluțiile legate de proiectul Bergamot, sunt menționate următoarele:

  • La Universitatea din Edinburgh funcționează dezvoltarea Cadrul de traducere automată mariană, care este construit pe baza unei rețele neuronale recurente. Cadrul este scris în C ++ și poate utiliza GPU pentru a accelera învățarea și traducerea. Proiectul intră sub licența MIT.
  • Instrumentul Neural Monkey s-a dezvoltat la Universitatea din Praga pentru a procesa informații despre limbajul natural folosind metode de învățare automată secvențială. Proiectul folosește cadrul TensorFlow și poate fi folosit pentru a prototipa sistemele de traducere automată și pentru a clasifica informațiile în limbaj natural. Codul este disponibil sub licența BSD.
  • Proiectul QuEst ++, care este dezvoltat la Universitatea din Sheffield, este utilizat pentru a evalua și a prezice calitatea sistemelor de traducere automată.
  • Mozilla dezvoltă un sintetizator de vorbire (TTS) și un motor de recunoaștere a vorbirii (Deep Speech)
  • Proiectul ParaCrawl, finanțat de Uniunea Europeană, care acumulează o bază de date cu traduceri simultane a mai multor fraze în diferite limbi, care pot fi utilizate pentru a forma sisteme de învățare automată.
  • Baza proiectului este bitextor, care este un bot, care indexează site-uri web multilingve și găsește automat aceleași texte prezentate în mai multe limbi. Baza de exemple de traducere paralelă este alcătuită din 24 de limbi.

Așa cum se arată în videoclipul demonstrativ, un nou buton va apărea în Firefox, când utilizatorul face clic pe acest buton puteți selecta limba în care doriți să traduceți. Alături va fi plasat un buton pentru a reveni la limba originală.

Dezvoltatorii spun că noul sistem local va oferi utilizatorilor o mai bună confidențialitate și protecție a datelor prin traducerea conținutului paginii în browser.

În urmă cu câțiva ani, Mozilla încerca deja să adauge o funcție de traducere similar cu Google Chrome din browser, dar l-a abandonat din cauza costurilor suport prea mare.

Firefox are o funcție încorporată pentru a traduce pagini, dar este legat de utilizarea serviciilor cloud externe (compatibil cu Google, Yandex și Bing) și nu este activat implicit. Pentru a activa funcția este necesar să mergeți la „despre: config”Și modificați setările din«browser.traducere").

Mecanismul de traducere acceptă, de asemenea, detectarea automată a limbii atunci când o pagină este deschisă într-o limbă necunoscută și afișează un indicator special cu o propunere de traducere a paginii.

Prototipul sistemului de traducere care este dezvoltat ca parte a proiectului Bergamot utilizează aceeași interfață pentru a interacționa cu utilizatorul. Acest sistem de traducere poate fi testat în Firefox Nightly activând setările browser.translation.ui.show y browser.translation.detectLanguagee.


Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: Miguel Ángel Gatón
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.