Mokslininkai kompiuterius prakalbino lietuviškai

Prof. Laimutis Telksnys įsitikinęs, jog pagaliau atvertos galimybės moksleiviams, suaugusiesiems, neįgaliesiems naudoti lietuviškai suprantančius ir lietuviškai šnekančius kompiuterius.

KAIP NEPASIKLYSTI ŠIUOLAIKINIŲ MEDIJŲ PLATUMOSE?

Visai neseniai apie balsu valdomą kompiuterį žinojome tik iš mokslinės fantastikos kūrinių, o šiandien tai daryti jau galima net ir kalbant lietuviškai. Galvoje turime ne karinę pramonę ar kitas aukštųjų technologijų kūrimo bei naudojimo sritis, o kasdienius mūsų palydovus: stacionarius, nešiojamuosius ar planšetinius kompiuterius, išmaniuosius mobiliuosius telefonus, išmaniuosius laikrodžius ir kitus technologiškai pažangius daiktus, kuriais galima dirbti valdant juos kalba. Su dauguma tokių prietaisų susikalbėti galima, deja, nelietuviškai. Tačiau padėtis iš esmės jau keičiasi, nes 2013–2015 metais Vilniaus universiteto Matematikos ir informatikos instituto (VU MII) mokslininkai, pasitelkę į pagalbą Lietuvos kalbos instituto (LKI), Lietuvos edukologijos (LEU) bei Šiaulių universitetų (ŠU) specialistus, įvykdė projektą, kurio metu sukurtos septynios lietuvių kalba valdomos paslaugos. Vadinasi, moksleiviai, suaugusieji, neįgalieji, verslininkai, ūkininkai, žodžiu, visi, kam tai aktualu, gali naudoti lietuvių kalbą suprantančius ir ja kalbančius kompiuterius. Apie projekto „Liepa“ metu vykusius darbus, sukurto galutinio produkto naudą bei atsiveriančias galimybes papasakojo projekto vadovas VU MII Atpažinimo procesų skyriaus afilijuotasis vyriausiasis mokslo darbuotojas prof. Laimutis Telksnys ir to paties skyriaus specialistas Gediminas Navickas.

Nuo idėjos iki fakto – penkiasdešimt metų
Pasak prof. L. Telksnio, idėja valdyti kompiuterį balsu kilo prieš pusę amžiaus. „Tuomet buvau tik pradėjęs dirbti skaičiavimo technikos srityje. Tačiau to meto problema buvo tai, kad skaičiavimo mašinos skaičiavo jau gana greitai, bet pateikti joms duomenis buvo labai sudėtinga ir viskas vyko labai lėtai. Šiandien viską surenkame naudodamiesi kompiuterio klaviatūra, o anuomet buvo naudojamos perfokortos. Jas turėtų prisiminti vyresnės kartos žmonės, susidūrę su to meto kompiuteriais. Jau tada galvoje kirbėjo mintis, kaip šį procesą supaprastinti iki komandų skaičiavimo mašinai davimo balsu.
Kodėl šis procesas užtruko gana ilgai? Visgi kompiuteriai nebuvo tokie tobuli, kad tuomet būtų buvę įmanoma padaryti tai, ko pasiekėme šiandien. Kai viskas jau padaryta, regis, viskas gana paprasta, bet toli gražu taip nėra. Kalbos atpažinimo procesas yra sudėtingas dalykas. Kiek­viena kalba yra labai specifinė, o lietuvių pasižymi ir dideliu, pavadinkime, lankstumu. Pavyzdžiui, skirtingai sukirčiavus žodį kaltas, gaunamos visiškai skirtingos reikšmės. O sakinių struktūros sudarymas dar sudėtingesnis. Todėl tam, kad kompiuteris skirtų labai subtilius lietuvių kalbos niuansus, reikėjo rimtai padirbėti.
Kalbos signalai aprašomi skaitmeninėmis lygtimis ir pagal kitus požymius, bet to vis tiek neužtenka. Norint, kad mašina atpažintų, kas jai sakoma ir kad ji pati taisyklingai kalbėtų, reikia šnekos pavyzdžių. Čia labai svarbios ir kalba perduodamos emocijos. Mums bendraujant tarpusavyje viskas atrodo paprasta, bet mašinai jas atpažinti labai sudėtinga, – sakė profesorius. – Nepaisant to, kad daug metų nuolat buvo vykdomi įvairūs eksperimentai, tik prieš dešimtmetį prasidėjo tikrai sistemingi tyrimai šioje srityje. O prieš trejus metus, kai atsirado galimybė pasinaudoti Europos Sąjungos parama, darbai pajudėjo iš esmės kryptingai, kad tiriamųjų darbų rezultatas taptų visiems prieinamomis paslaugomis. 2012 m. pradėtas vykdyti projektas „Liepa“ – lietuvių šneka valdomos paslaugos, šiandien jau baigtas.

Laukia siūlymų, ką tobulinti
„Pradėję šį projektą iš karto teigėme, kad visiškai pasinaudoti užsienio patirtimi neįmanoma. Reikėjo suvienyti fundamentalias lietuvių kalbininkų ir informatikos specialistų žinias. Ši sąsaja – visa ko esmė, o galutinis geidžiamas rezultatas – galimybę lietuviškai valdyti kompiuterius suteikti kuo didesnei visuomenės daliai. Pirma, norėjome, kad su šiomis paslaugomis kuo plačiau susipažintų moksleiviai. Jiems sukurtos dvi priemonės: biologijos pamokoms skirta skaitmeninė mokomoji priemonė, leidžianti inovatyviai aiškintis ląstelės sandarą ir su ląstele susijusius procesus, bei geografijos pamokoms skirta priemonė, leidžianti mokiniams praplėsti akiratį skaitant, peržiūrint, išklausant priemonės kūrėjų sukauptą pažintinę medžiagą. Mums labai svarbu dar ir tai, kad naudotojai įvertintų priemonių naudingumą, funkcionalumą ir siūlytų, ką dar reikėtų tobulinti.
Noriu ypač pabrėžti tai, kad mūsų sukurtos paslaugos yra visiems atviros ir nemokamos. Visą informaciją galima rasti interneto svetainėje liepa.raštija.lt. Kai kuriose pozicijose reikalinga registracija, bet visu mūsų kūriniu gali naudotis absoliučiai kiekvienas to norintis“, – tvirtino prof. L. Telksnys.
Gediminas Navickas sakė, jog projekto pagrindinis tikslas – rezultatus pateikti prieinamus visiems: „Ir ne tik laisvai naudotis sukurtomis paslaugomis, bet, kaip jau minėjo profesorius, galima prisidėti prie jų tobulinimo, t. y. tie, kurie domisi atpažintuvų, elektroninio teksto skaitytuvų galimybėmis, gali gauti jų programinį kodą ir laisvai naudoti jį kurdami naujus produktus bei paslaugas, turinčias lietuvių šnekos atpažinimo ir sintezės funkcijas.“

Naujos galimybės neįgaliesiems
Pasak prof. L. Telksnio, lietuviškai kompiuterį prakalbinti labai padėjo bendradarbiavimas su turinčiaisiais regėjimo negalią. „Juk daugeliui gali kilti klausimas, kaip aklas žmogus gali dirbti kompiuteriu? Pasirodo, kad aklieji puikiai išmoksta naudotis įprastine kompiuterio klaviatūra, o naudojant mūsų sukurtą paslaugą, informaciją, kurią mes matome ekrane, jiems balsu perskaito kompiuterinis sintezatorius. Žinoma, dar reikalingos specialios ekrano skaitymo programos, kurios paima informaciją iš ekrano ir perduoda sintezatoriui.
O, pavyzdžiui, paslauga „Naršytuvas“ gali visiškai pakeisti įprastines naršymo sąsajos priemones – pelę ir klaviatūrą, todėl gali būti panaudota tiek kaip speciali priemonė didelę fizinę negalią turintiems asmenims, tiek kaip alternatyvi naršymo priemonė visiems naudotojams.“
G. Navicko teigimu, dar viena sukurta paslauga ypač verta dėmesio – „Pagalbininkas“. „Ji padeda mokytis lietuvių kalbos ir lavinti socialinius įgūdžius. „Pagalbininkas“ siūlo išgirsti visus lietuvių kalbos abėcėlės garsus, dvigarsius ir dvibalsius bei 300 žodžių, kuriuose šie garsai girdimi. Be to, paslauga siūlo vartotojui sudalyvauti keturiose bendravimo situacijose, kurios dažniausiai pasitaiko gyvenime. Tai socialiniai kontekstai: „Aš ir kiti“, „Pas gydytoją“, „Kavinė“, „Parduotuvė“. Vartotojas gali rinktis bet kurį animuotą personažą iš keturių siūlomų. Šie sudaro galimybę vartotojui išbandyti įvairius vaidmenis, o padarius klaidą, „Pagalbininkas“ pasiūlo rinktis vieną iš keturių pagalbos rūšių: pakartoti visą pamirštą frazę, paimti vieną raktinį žodį, parodyti frazę su sumaišyta žodžių seka arba frazę, neatitinkančią socialinio konteksto prasmės“, – aiškino G. Navickas.

Kalba taisyklingai ir maloniu tembru
Anot G. Navicko, keturios sukurtos paslaugos yra pasiekiamos tiesiog internetu, o trys – diegiamos į kompiuterį: „Jeigu vartotojas nori ką nors kurti pats, mūsų siūlomi pagrindiniai produktai jam tokią galimybę suteikia. Šnekant populiariai, jeigu kažkas pasigamina mašinos kėbulą, variklį ir vidaus įrangą mes tiesiog duodame nemokamai. Žinoma, tam tikrus programavimo pagrindus reikia turėti.“
Prof. L. Telksnys įsitikinęs, kad kalbantį kompiuterį girdėti teko daugeliui. Tačiau kompiuteris, kuris geba perskaityti tekstą taisyklinga lietuvių kalba ir ausiai maloniu bei priimtinu balsu, turėtų būti labai intriguojanti naujovė. „Būtent projekte „Liepa“ pavyko kompiuterį prakalbinti lietuviškai, be to, kompiuterio balsą jau sunku atskirti nuo gyvo žmogaus balso. Tai pasiekėme panaudoję naują šnekos sintezės metodą, kurio esmė yra rasti diktoriaus balso įrašų bazėje kuo ilgesnius tinkamus fragmentus ir iš jų „suklijuoti“ naują įrašą, idealiu atveju galima rasti visą įrašytą sakinį, bet dažniausiai randami žodžiai, žodžio dalys, skiemenys, blogiausiu atveju „klijuojama“ iš atskirų garsų. Taigi kompiuteris kalba keturiais balsais: vyriškais ir moteriškais, jaunais ir solidžiais. Garsų bazių apimtis po 5 tūkst. sakinių, o tai yra apie 160 tūkst. garsų arba 3,5 val. įrašo. Kartu su įrašais saugoma ir jų transkripcija, pagal kurią ir atliekama paieška. Prieš atliekant paiešką kompiuteriu tenka įveikti ir lietuvių kalbos fonologijos, morfologijos ir akcentologijos džiungles, kol iš teksto išgaunama transkripcija, – rišlios ir gražios kompiuterio lietuvių šnekos paslaptis aiškino prof. L. Telksnys. – Mūsų įvykdyto projekto tikslas – atverti kelią lietuvių kalbai į elektroninę erdvę – pasiektas, tačiau tai tikrai ne pabaiga ir planuojamas antrasis projektas „Liepa2“ lietuviškai valdomo ir kalbančio kompiuterio galimybes dar labiau išplės. O užbaigti noriu „Microsoft“ kompanijos stratego Davido Brookso žodžiais: „Kalba, kuri nepasklis elektroninėje terpėje, greitai taps nevartojama“, tad džiugu, kad mūsų gimtajai kalbai tai jau negresia.“

Elena RINKEVIČIENĖ
„ŪP“ korespondentė

Autorės nuotraukos

Rašinių ciklą iš dalies finansuoja Lietuvos kultūros tarybos administruojamas Kultūros rė­mimo fondas

UP Peržiūrėti visą numerį galite ČIA.