Pereiti prie turinio

KTU mokslininkė Ramunė Kasperė: ar karo laikotarpiu pakanka vertimo programėlių pagalbos?

Bendruomenė žiniasklaidai | 2022-06-14

Ramunė Kasperė yra Kauno technologijos universiteto Socialinių, humanitarinių mokslų ir menų fakulteto profesorė

Karo akivaizdoje prieglobstį Lietuvoje rado daugiau nei 55 tūkst. ukrainiečių. Šalia būsto, darbo ir kitokių reikmių paieškos, nemažu iššūkiu atvykusiesiems tampa ir kalbos barjeras. Nors įvairiems atvejams pakanka anglų ar rusų kalbos žinių, nemaža dalis ukrainiečių jau mokosi lietuvių kalbos, o lietuviai – ukrainiečių.

Tačiau kol kas įvairioms svarbioms situacijoms yra pasitelkiamos kalbos technologijos, kurios nors ir padeda, nebūtinai stebina geriausiais rezultatais. Todėl, verta pasvarstyti, ar turimų technologijų ir jų suteikiamų naudų bei pranašumų šiandien pakanka?

Mašininis vertimas gelbsti krizių metu

KTU Ramunė Kasperė
Ramunė Kasperė

Pastaruoju metu vis dažniau girdime apie atvejus, kai svarbiomis ir kritinėmis situacijomis vertimui naudojamos įvairios mašininį vertimą integruojančios programėlės. Dar prieš keletą mėnesių spręsdami nelegalios migracijos problemas, Lietuvos pareigūnai naudojosi mašininio vertimo programėlėmis komunikacijai su migrantais.

Greičiausiai buvo sprendžiami ne tik paprasti kasdieniai – apgyvendinimo, aprūpinimo maistu ar drabužiais – klausimai, bet ir teisinės, psichologinės bei kitos jautrios ir įvairias rizikas keliančios problemos.

Kalbant apie komunikaciją įvairiais ypatingos svarbos ir jautriais klausimais su žmonėmis, patiriančiais fizinių, socialinių, psichologinių ir emocinių problemų, mašininis vertimas tikrai nėra patikimas.

Tačiau neretais atvejais mašininį vertimą integruojančios kalbos technologijos tampa vienintele priemone, leidžiančia čia ir dabar suprasti kitos tautybės, kultūros ir kita kalba kalbantį asmenį, todėl jos vis labiau skinasi kelią į oficialias situacijas ir aplinkas. Lietuvoje prieglobsčio ieškantiems ukrainiečiams kalbos technologijos pasitarnauja įvairiais tikslais ir įvairiose svarbiose situacijose.

Kalbos technologijos kol kas nepamainomos ir mokykloje

Lietuvoje ukrainiečiams sudaryta daug galimybių mokytis lietuvių kalbos. Universitetai, taip pat ir Kauno technologijos universitetas (KTU), siekia padėti nuo karo bėgantiems ukrainiečiams sklandžiau integruotis visuomenėje per įvairias kalbos mokymosi, šalies ir kultūros pažinimo iniciatyvas. Tačiau kalbos išmokstama ne taip greitai. Tam gali prireikti metų, kartais net kelių.

Lietuvos mokyklose mokosi šimtai ukrainiečių moksleivių, o kai kurie jų net rengiasi laikyti brandos egzaminus. Mokiniai kasdien bendrauja su lietuviais mokytojais ir pedagogais tiek anglų, tiek rusų kalbomis. Siekdami tinkamai ir kokybiškai išsiaiškinti praleistas, neįsisavintas įvairių dalykų temas, mokytojai ir ukrainiečių mokiniai griebiasi visiems lengvai, laisvai ir nemokamai prieinamų vertyklių.

Kokybė – pakankama?

Gerai žinoma, kad mašininės vertyklės generuoja įvairios kokybės vertimą. Ji priklauso nuo to, kokiais ir kokios apimties duomenimis jos yra apmokytos. Didelių, pasaulyje paplitusių kalbų kombinacijose – kinų-anglų, anglų-vokiečių, rusų-anglų – mašininio vertimo kokybė greitai auga. Tyrimais įvairiose kalbose jau nustatoma, kad mašininis vertimas gali lygintis su žmogaus vertėjo atlikto vertimo kokybe, ypač verčiant tam tikrų tipų tekstus, pavyzdžiui, naujienas.

Tinkamais duomenimis apmokytos ir didžiuliais duomenų rinkiniais paremtos vertyklės gali duoti puikių rezultatų teisės, techniniuose, moksliniuose ar administraciniuose tekstuose, instrukcijose. Tokie pasiekimai dažniausiai fiksuojami vien tik mašininio vertimo vertyklėmis, kur tekstas įvedamas ir gaunamas jo vertimo rezultatas tekstu.

Integruojant šnekos ar vaizdo atpažinimą, kai tekstas įkalbamas arba atpažįstamas iš vaizdo, tai yra nuotraukos, paveikslėlio ar ženklo, mašininio vertimo kokybė stipriai sumenksta. Kitaip tariant, atpažinimo etape gaunamas nekokybiškas rezultatas automatiškai lemia dar blogesnę vertimo kokybę. Vienas svarbiausių šnekos atpažinimo momentų yra šnekos įvesties fiksavimas. Tam gali turėti įtakos įvairūs veiksniai, tokie kaip foniniai garsai, kalbančiojo akcentas, kartais net intonacija, atstumas tarp kalbėtojo ir mikrofono, įšnekamo teksto ilgis.

Atlikdami tyrimus matome, kad, pavyzdžiui, šnekos atpažinimo etapo metu nukandamos žodžių galūnės, suplakami žodžiai ar pakeičiami kitais panašiais žodžiais, sakinio pabaigoje neužfiksuojami vienas ar net keli žodžiai.

Mašininio vertimo į lietuvių kalbą tyrimai rodo, kad mašininio vertimo kokybė iš įkalbamo teksto, tai yra šnekos, yra nepakankama ir dažnu atveju netgi labai bloga. Šnekos atpažinimo kokybė automatiškai paveikia galutinį vertimo rezultatą. Turint omenyje tai, kad pirmoji šnekos atpažinimo sistema buvo sukurta dar praeito amžiaus viduryje ir nuo to laiko jau 7 dešimtmečius vyksta nepaliaujama technologinė pažanga, būtų galima tikėtis geresnių šnekos atpažinimo rezultatų.

Programėlės, leidžiančios užfiksuoti vaizdą, konvertuoti jį į tekstą ir tą tekstą išversti į kitą kalbą teksto ar net šnekos formatu jau taip pat nėra tik svajonė. Vis tik svarbu pasiekti tokią vaizdo atpažinimo kokybę, kad konvertuotas tekstas būtų labai kokybiškas ir be klaidų jau vaizdo atpažinimo etape.

Bet kokiame scenarijuje aukštos kokybės originalus tekstas yra kritiškai svarbus. Jei yra klaida originalo tekste, ji visada lemia klaidą ir vertimo tekste. O tokios klaidos gali atsirasti dėl sudėtingesnio ar neįprasto teksto šrifto vaizde, fono blizgumo, netinkamo apšvietimo sąlygų ar didesnių vaizdo iškraipymų. Tyrimų rezultatai kol kas tokie, kad pakankama kokybė generuojama tik trumpo teksto vaizde atveju, daugiausiai – iki vieno nesudėtingo sakinio.

Iššūkiai ir jų sprendiniai

Dirbtinio intelekto vystymas leis ištobulinti šnekos, vaizdo atpažinimo ir mašininio vertimo technologijas dar labiau. Pagrindinė mokslininkų ir technologijų vystytojų užduotis – įvertinti, kaip geriausiai panaudoti dirbtinį intelektą, kad technologijas kasdieniams poreikiams būtų galima pasitelkti be didelių rizikų. Tačiau taip pat svarbu edukuoti visuomenę apie kuriamų technologinių produktų galimybes, apie tai, ką šios technologijos gali ir ko ne.

Mašininį vertimą integruojančių programėlių naudotojai neturėtų aklai pasitikėti generuojama kokybe. KTU atliekamo tyrimo apie dirbtiniu intelektu grįstų mašininio vertimo technologinių sprendimų poveikį visuomenei rezultatai rodo, kad kuo mažiau mašininio vertimo programėlės naudotojai moka kalbą, iš kurios verčia, tuo labiau jie linkę pasitikėti gautu rezultatu, kuris, deja, yra nebūtinai teisingas ar kokybiškas.

Todėl kokybę reikėtų pabandyti, kiek įmanoma, užtikrinti patiems, ypač vertimo tikslumo reikalaujančiose situacijose, pavyzdžiui, skaitant sudėtingus tekstus, bendraujant nežinomomis temomis, kai vartojami nauji terminai ar nežinomos sąvokos. Įrankių, ypač mašininio vertimo programėlių, yra daug. Kai kurie mokami, kiti laisvai prieinami. Jei būtinai reikia pasitelkti mašininį vertimą, geriau vertimo rezultatą pasitikrinti keliomis programėlėmis, dažniau naudoti vertimą iš teksto į tekstą, o kitas formas, tokias kaip šneka ar vaizdas, pasilikti išskirtiniams atvejams.

Ukrainiečiams mokiniams, besirengiantiems egzaminams Lietuvoje, reikėtų nepamiršti, kad vertimo kokybė ukrainiečių-lietuvių kalbų kombinacijoje gali būti prastesnė nei, pavyzdžiui, ukrainiečių-anglų ar rusų-anglų, todėl verta tą pačią informaciją patikrinti ne tik keliais įrankiais, bet ir keliomis kalbomis. Net ir nemokėdami kalbos, galime padaryti daugiau, kad būtume suprasti teisingai ir teisingai suprastume kitus.