2022.08.17. 12:43
Az angol közbeiktatása nélkül fordít kétszáz nyelv között a Meta legújabb fejlesztése
Szuperkönnyű a fordítás a nagy nyelvek esetén, sokkal nehezebb, ha minőségi tartalmat keresünk valamelyik egzotikus nyelven.

Illusztráció
Forrás: Shutterstock
A hétezer beszélt nyelv közül van, amelyet több milliárdan megértenek, de olyan is bőséggel akad, amelyet pár százan, esetleg néhány ezren beszélnek. A különböző nyelvek közötti átmenetet megkönnyítő mesterségesintelligencia-alkalmazások közül a legújabb fejlesztés kétszáz nyelven ért - hívta fel a figyelmet a programra cikkében a Magyar Nemzet.
Két adott nyelv közötti fordítás – különösen, ha egyik sem angol – jelentős kihívásnak bizonyult a mesterséges intelligencia nyelvi modelljei számára, mert e fordítórendszerek alapvetően az internetről származó írott adatokra támaszkodnak. Szuperkönnyű a fordítás a nagy nyelvek esetén, sokkal nehezebb, ha minőségi tartalmat keresünk valamelyik egzotikus nyelven.
A Facebook, amely tavaly október óta Meta néven ismert, hat hónappal ezelőtt elindította ambiciózus No Language Left Behind (NLLB) projektjét, amelynek célja, hogy a mesterséges intelligencia segítségével zökkenőmentesen fordítson számos nyelv között anélkül, hogy a szöveget először angolra kellene átültetni.
Azaz egy magyar szöveget az angol közbeiktatása nélkül alakítana át például izlandira. A cég első nagy sikere az NLLB-200 névre keresztelt mesterségesintelligencia-modell, amely elvileg kétszáz nyelven tud beszélni, köztük számos kevésbé széles körben beszélten Ázsiából és Afrikából, például laoszi és kamba nyelven.
A cég szerint az NLLB-200 egyebek mellett 55 afrikai nyelvet fordít le kiváló minőségben. A Meta fejlesztői azzal büszkélkednek, hogy a modell teljesítménye átlagosan 44 százalékkal, a kiválasztott afrikai és indiai dialektusok esetében pedig hetven százalékkal felülmúlja a meglévő (nyelvátültető) csúcsmodelleket.
A legtöbb nyilvánosan támogatott mesterségesintelligencia-programhoz hasonlóan a Meta is nyílt forráskódúvá, azaz szabadon felhasználhatóvá teszi a programot, valamint kétszázezer dolláros támogatást nyújt nonprofit szervezeteknek, hogy további alkalmazásokat fejlesszenek ki a technológia használatával.
Képzeld el, hogy felkeresed kedvenc Facebook-csoportod, ahol találkozol egy luganda nyelven írt bejegyzéssel! Egyetlen gombnyomással meg tudod érteni azt a saját nyelveden
– indokolta a kezdeményezést a Meta.
Az új modell működésének megértését demóprogram segíti, amely a No Language Left Behind program legújabb fejlesztéseit használja. A szövegeket származási nyelvükről, például indonézről, szomáliról és burmairól fordítja le – az elkövetkező hónapokban – több száz nyelvre.
Ezzel a mesterségesintelligencia-eszközzel a családok a világ minden táján mostantól együtt olvashatnak történeteket anyanyelvükön. E cikk írásakor A herceg és a tigris minangkabau nyelven írt mesét – Indonéziában használt nyelvről van szó – angolra fordították, de baszkul, katalánul, portugálul és még néhány nyelven szintén elérhető a szöveg. A magyar még nem szerepelt a kiválasztottak között.