Gumagawa na ang Mozilla sa pagbuo ng sarili nitong system ng pagsasalin ng makina

Tagasalin ng Firefox

Nagpakawala na si Mozilla bilang bahagi ng proyekto ng Bergamot, ang paglulunsad ng isang sistema ng pagsasalin ng makina nakabase sa browser, isang bagay katulad ng tagasalin ng Chrome, ngunit may pagkakaiba iyan ay ang pagpipiliang upang isalin ang mga web page sa Firefox gagana ito nang walang koneksyon sa internet.

Ang paglulunsad ng proyektong ito papayagan ang isang nag-iisang engine ng pagsasalin ng pahina na isama sa Firefox hindi pag-access sa mga panlabas na serbisyo ng ulap at eksklusibong nagpoproseso ng data sa system ng gumagamit. Ang pangunahing layunin ng pagbuo ng proyektong ito ay upang magarantiyahan ang pagiging kompidensiyal at protektahan ang data ng gumagamit mula sa mga posibleng pagtagas kapag isinasalin ang nilalaman ng mga pahina na binuksan sa browser.

Ang Bergamot ay binuo sa punong tanggapan ng Mozilla sa Berlin sa pakikilahok ng mga mananaliksik mula sa iba`t ibang pamantasan sa UK, Estonia at Czech Republic. Ang kaunlaran ay pinopondohan ng European Union bilang bahagi ng isang bigay na natanggap sa ilalim ng Horizon 2020 na programa.

Ang halaga ng suportang ito ay halos tatlong milyong euro. Ang proyekto ay dinisenyo sa loob ng tatlong taon. Si Mozilla ay nagbukas ng trabaho bilang isang dalubhasa sa mga sistema ng pag-aaral ng makina upang lumahok sa pagbuo ng isang makina para sa pagsasalin mula sa isang wika patungo sa isa pa.

Sa mga pagpapaunlad na nauugnay sa proyekto ng Bergamot, ang mga sumusunod ay nabanggit:

  • Nagtatrabaho ang University of Edinburgh ang pag-unlad ng Balangkas ng pagsasalin ng makina ng Marian, na itinayo batay sa isang paulit-ulit na neural network. Ang balangkas ay nakasulat sa C ++, at maaaring magamit ang GPU upang mapabilis ang pag-aaral at pagsasalin. Ang proyekto ay nasa ilalim ng lisensya ng MIT.
  • Ang tool Ang Neural Monkey ay binuo sa University of Prague upang maproseso ang impormasyong natural na wika gamit ang mga sunud-sunod na pamamaraan ng pag-aaral ng makina. Ang proyekto gumagamit ng balangkas na TensorFlow at maaari itong magamit upang prototype ang mga sistema ng pagsasalin ng makina at inuri ang impormasyon sa natural na wika. Magagamit ang code sa ilalim ng lisensya ng BSD.
  • Ang proyekto ng QuEst ++, na binuo sa University of Sheffield, ay ginagamit upang suriin at hulaan ang kalidad ng mga system ng pagsasalin ng makina.
  • Bumubuo ang Mozilla sa isang speech synthesizer (TTS) at engine pagkilala sa pagsasalita (Deep Speech)
  • Ang proyekto ParaCrawl, pinondohan ng European Union, na naipon ng isang database ng sabay-sabay na mga pagsasalin ng maraming mga parirala sa iba't ibang mga wika, na maaaring magamit upang mabuo ang mga sistema ng pag-aaral ng machine.
  • Ang batayan ng proyekto ay ang bitextor, na isang bot, na nag-index ng mga multilingual na website at awtomatikong hahanapin ang parehong mga teksto na ipinakita sa maraming mga wika. Ang magkatulad na halimbawa ng halimbawa ng pagsasalin ay binubuo ng 24 na wika.

Tulad ng ipinakita sa demo na video, lilitaw ang isang bagong pindutan sa Firefox, kapag nag-click ang gumagamit sa pindutang ito maaari mong piliin ang wika kung saan mo nais isalin. Sa tabi nito ay mailalagay ang isang pindutan upang bumalik sa orihinal na wika.

Sinabi ng mga developer na ang bagong lokal na system ay magbibigay ng mas mahusay na privacy at proteksyon ng data para sa mga gumagamit sa pamamagitan ng pagsasalin ng nilalaman ng pahina sa browser.

Ilang taon na ang nakakalipas, sinusubukan na ni Mozilla na magdagdag ng isang tampok sa pagsasalin katulad ng Google Chrome sa iyong browser, ngunit inabandona ito dahil sa mga gastos masyadong mataas ang suporta.

Ang Firefox ay may built-in na tampok upang isalin ang mga pahina, ngunit naka-link ito sa paggamit ng mga panlabas na serbisyo sa cloud (katugma sa Google, Yandex at Bing) at hindi ito pinagana bilang default. Upang buhayin ang pagpapaandar kinakailangan upang pumunta sa "tungkol sa: config”At palitan ang mga setting ng«browser.translasyon").

Sinusuportahan din ng mekanismo ng pagsasalin ang awtomatikong pagtuklas ng wika kapag binuksan ang isang pahina sa isang hindi kilalang wika at nagpapakita ng isang espesyal na tagapagpahiwatig na may panukalang isalin ang pahina.

Ang prototype ng sistema ng pagsasalin na binubuo bilang bahagi ng proyekto Gumamot ay gumagamit ng parehong interface upang makipag-ugnay sa gumagamit. Sistema ng pagsasalin na ito maaaring masubukan sa Firefox Gabi-gabi sa pamamagitan ng pagpapagana ng mga setting browser.translation.ui.show y browser.translation.detectLanguagee.


Iwanan ang iyong puna

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan ng *

*

*

  1. Responsable para sa data: Miguel Ángel Gatón
  2. Layunin ng data: Kontrolin ang SPAM, pamamahala ng komento.
  3. Legitimation: Ang iyong pahintulot
  4. Komunikasyon ng data: Ang data ay hindi maiparating sa mga third party maliban sa ligal na obligasyon.
  5. Imbakan ng data: Ang database na naka-host ng Occentus Networks (EU)
  6. Mga Karapatan: Sa anumang oras maaari mong limitahan, mabawi at tanggalin ang iyong impormasyon.