Ashburn +7,0 °C Debesuota
Pirmadienis, 30 Sau 2023
Spausdintų leidinių prenumerata
Ashburn +7,0 °C Debesuota
Pirmadienis, 30 Sau 2023

Mokslininkai kompiuterius prakalbino lietuviškai

2015/10/24


Prof. Laimutis Telksnys įsitikinęs, jog pagaliau atvertos galimybės moksleiviams, suaugusiesiems, neįgaliesiems naudoti lietuviškai suprantančius ir lietuviškai šnekančius kompiuterius.

KAIP NEPASIKLYSTI ŠIUOLAIKINIŲ MEDIJŲ PLATUMOSE?

Visai neseniai apie balsu valdomą kompiuterį žinojome tik iš mokslinės fantastikos kūrinių, o šiandien tai daryti jau galima net ir kalbant lietuviškai. Galvoje turime ne karinę pramonę ar kitas aukštųjų technologijų kūrimo bei naudojimo sritis, o kasdienius mūsų palydovus: stacionarius, nešiojamuosius ar planšetinius kompiuterius, išmaniuosius mobiliuosius telefonus, išmaniuosius laikrodžius ir kitus technologiškai pažangius daiktus, kuriais galima dirbti valdant juos kalba. Su dauguma tokių prietaisų susikalbėti galima, deja, nelietuviškai. Tačiau padėtis iš esmės jau keičiasi, nes 2013–2015 metais Vilniaus universiteto Matematikos ir informatikos instituto (VU MII) mokslininkai, pasitelkę į pagalbą Lietuvos kalbos instituto (LKI), Lietuvos edukologijos (LEU) bei Šiaulių universitetų (ŠU) specialistus, įvykdė projektą, kurio metu sukurtos septynios lietuvių kalba valdomos paslaugos. Vadinasi, moksleiviai, suaugusieji, neįgalieji, verslininkai, ūkininkai, žodžiu, visi, kam tai aktualu, gali naudoti lietuvių kalbą suprantančius ir ja kalbančius kompiuterius. Apie projekto „Liepa“ metu vykusius darbus, sukurto galutinio produkto naudą bei atsiveriančias galimybes papasakojo projekto vadovas VU MII Atpažinimo procesų skyriaus afilijuotasis vyriausiasis mokslo darbuotojas prof. Laimutis Telksnys ir to paties skyriaus specialistas Gediminas Navickas.

Nuo idėjos iki fakto – penkiasdešimt metų Pasak prof. L. Telksnio, idėja valdyti kompiuterį balsu kilo prieš pusę amžiaus. „Tuomet buvau tik pradėjęs dirbti skaičiavimo technikos srityje. Tačiau to meto problema buvo tai, kad skaičiavimo mašinos skaičiavo jau gana greitai, bet pateikti joms duomenis buvo labai sudėtinga ir viskas vyko labai lėtai. Šiandien viską surenkame naudodamiesi kompiuterio klaviatūra, o anuomet buvo naudojamos perfokortos. Jas turėtų prisiminti vyresnės kartos žmonės, susidūrę su to meto kompiuteriais. Jau tada galvoje kirbėjo mintis, kaip šį procesą supaprastinti iki komandų skaičiavimo mašinai davimo balsu. Kodėl šis procesas užtruko gana ilgai? Visgi kompiuteriai nebuvo tokie tobuli, kad tuomet būtų buvę įmanoma padaryti tai, ko pasiekėme šiandien. Kai viskas jau padaryta, regis, viskas gana paprasta, bet toli gražu taip nėra. Kalbos atpažinimo procesas yra sudėtingas dalykas. Kiek­viena kalba yra labai specifinė, o lietuvių pasižymi ir dideliu, pavadinkime, lankstumu. Pavyzdžiui, skirtingai sukirčiavus žodį kaltas, gaunamos visiškai skirtingos reikšmės. O sakinių struktūros sudarymas dar sudėtingesnis. Todėl tam, kad kompiuteris skirtų labai subtilius lietuvių kalbos niuansus, reikėjo rimtai padirbėti. Kalbos signalai aprašomi skaitmeninėmis lygtimis ir pagal kitus požymius, bet to vis tiek neužtenka. Norint, kad mašina atpažintų, kas jai sakoma ir kad ji pati taisyklingai kalbėtų, reikia šnekos pavyzdžių. Čia labai svarbios ir kalba perduodamos emocijos. Mums bendraujant tarpusavyje viskas atrodo paprasta, bet mašinai jas atpažinti labai sudėtinga, – sakė profesorius. – Nepaisant to, kad daug metų nuolat buvo vykdomi įvairūs eksperimentai, tik prieš dešimtmetį prasidėjo tikrai sistemingi tyrimai šioje srityje. O prieš trejus metus, kai atsirado galimybė pasinaudoti Europos Sąjungos parama, darbai pajudėjo iš esmės kryptingai, kad tiriamųjų darbų rezultatas taptų visiems prieinamomis paslaugomis. 2012 m. pradėtas vykdyti projektas „Liepa“ – lietuvių šneka valdomos paslaugos, šiandien jau baigtas.

Laukia siūlymų, ką tobulinti „Pradėję šį projektą iš karto teigėme, kad visiškai pasinaudoti užsienio patirtimi neįmanoma. Reikėjo suvienyti fundamentalias lietuvių kalbininkų ir informatikos specialistų žinias. Ši sąsaja – visa ko esmė, o galutinis geidžiamas rezultatas – galimybę lietuviškai valdyti kompiuterius suteikti kuo didesnei visuomenės daliai. Pirma, norėjome, kad su šiomis paslaugomis kuo plačiau susipažintų moksleiviai. Jiems sukurtos dvi priemonės: biologijos pamokoms skirta skaitmeninė mokomoji priemonė, leidžianti inovatyviai aiškintis ląstelės sandarą ir su ląstele susijusius procesus, bei geografijos pamokoms skirta priemonė, leidžianti mokiniams praplėsti akiratį skaitant, peržiūrint, išklausant priemonės kūrėjų sukauptą pažintinę medžiagą. Mums labai svarbu dar ir tai, kad naudotojai įvertintų priemonių naudingumą, funkcionalumą ir siūlytų, ką dar reikėtų tobulinti. Noriu ypač pabrėžti tai, kad mūsų sukurtos paslaugos yra visiems atviros ir nemokamos. Visą informaciją galima rasti interneto svetainėje liepa.raštija.lt. Kai kuriose pozicijose reikalinga registracija, bet visu mūsų kūriniu gali naudotis absoliučiai kiekvienas to norintis“, – tvirtino prof. L. Telksnys. Gediminas Navickas sakė, jog projekto pagrindinis tikslas – rezultatus pateikti prieinamus visiems: „Ir ne tik laisvai naudotis sukurtomis paslaugomis, bet, kaip jau minėjo profesorius, galima prisidėti prie jų tobulinimo, t. y. tie, kurie domisi atpažintuvų, elektroninio teksto skaitytuvų galimybėmis, gali gauti jų programinį kodą ir laisvai naudoti jį kurdami naujus produktus bei paslaugas, turinčias lietuvių šnekos atpažinimo ir sintezės funkcijas.“

Naujos galimybės neįgaliesiems Pasak prof. L. Telksnio, lietuviškai kompiuterį prakalbinti labai padėjo bendradarbiavimas su turinčiaisiais regėjimo negalią. „Juk daugeliui gali kilti klausimas, kaip aklas žmogus gali dirbti kompiuteriu? Pasirodo, kad aklieji puikiai išmoksta naudotis įprastine kompiuterio klaviatūra, o naudojant mūsų sukurtą paslaugą, informaciją, kurią mes matome ekrane, jiems balsu perskaito kompiuterinis sintezatorius. Žinoma, dar reikalingos specialios ekrano skaitymo programos, kurios paima informaciją iš ekrano ir perduoda sintezatoriui. O, pavyzdžiui, paslauga „Naršytuvas“ gali visiškai pakeisti įprastines naršymo sąsajos priemones – pelę ir klaviatūrą, todėl gali būti panaudota tiek kaip speciali priemonė didelę fizinę negalią turintiems asmenims, tiek kaip alternatyvi naršymo priemonė visiems naudotojams.“ G. Navicko teigimu, dar viena sukurta paslauga ypač verta dėmesio – „Pagalbininkas“. „Ji padeda mokytis lietuvių kalbos ir lavinti socialinius įgūdžius. „Pagalbininkas“ siūlo išgirsti visus lietuvių kalbos abėcėlės garsus, dvigarsius ir dvibalsius bei 300 žodžių, kuriuose šie garsai girdimi. Be to, paslauga siūlo vartotojui sudalyvauti keturiose bendravimo situacijose, kurios dažniausiai pasitaiko gyvenime. Tai socialiniai kontekstai: „Aš ir kiti“, „Pas gydytoją“, „Kavinė“, „Parduotuvė“. Vartotojas gali rinktis bet kurį animuotą personažą iš keturių siūlomų. Šie sudaro galimybę vartotojui išbandyti įvairius vaidmenis, o padarius klaidą, „Pagalbininkas“ pasiūlo rinktis vieną iš keturių pagalbos rūšių: pakartoti visą pamirštą frazę, paimti vieną raktinį žodį, parodyti frazę su sumaišyta žodžių seka arba frazę, neatitinkančią socialinio konteksto prasmės“, – aiškino G. Navickas.

Kalba taisyklingai ir maloniu tembru Anot G. Navicko, keturios sukurtos paslaugos yra pasiekiamos tiesiog internetu, o trys – diegiamos į kompiuterį: „Jeigu vartotojas nori ką nors kurti pats, mūsų siūlomi pagrindiniai produktai jam tokią galimybę suteikia. Šnekant populiariai, jeigu kažkas pasigamina mašinos kėbulą, variklį ir vidaus įrangą mes tiesiog duodame nemokamai. Žinoma, tam tikrus programavimo pagrindus reikia turėti.“ Prof. L. Telksnys įsitikinęs, kad kalbantį kompiuterį girdėti teko daugeliui. Tačiau kompiuteris, kuris geba perskaityti tekstą taisyklinga lietuvių kalba ir ausiai maloniu bei priimtinu balsu, turėtų būti labai intriguojanti naujovė. „Būtent projekte „Liepa“ pavyko kompiuterį prakalbinti lietuviškai, be to, kompiuterio balsą jau sunku atskirti nuo gyvo žmogaus balso. Tai pasiekėme panaudoję naują šnekos sintezės metodą, kurio esmė yra rasti diktoriaus balso įrašų bazėje kuo ilgesnius tinkamus fragmentus ir iš jų „suklijuoti“ naują įrašą, idealiu atveju galima rasti visą įrašytą sakinį, bet dažniausiai randami žodžiai, žodžio dalys, skiemenys, blogiausiu atveju „klijuojama“ iš atskirų garsų. Taigi kompiuteris kalba keturiais balsais: vyriškais ir moteriškais, jaunais ir solidžiais. Garsų bazių apimtis po 5 tūkst. sakinių, o tai yra apie 160 tūkst. garsų arba 3,5 val. įrašo. Kartu su įrašais saugoma ir jų transkripcija, pagal kurią ir atliekama paieška. Prieš atliekant paiešką kompiuteriu tenka įveikti ir lietuvių kalbos fonologijos, morfologijos ir akcentologijos džiungles, kol iš teksto išgaunama transkripcija, – rišlios ir gražios kompiuterio lietuvių šnekos paslaptis aiškino prof. L. Telksnys. – Mūsų įvykdyto projekto tikslas – atverti kelią lietuvių kalbai į elektroninę erdvę – pasiektas, tačiau tai tikrai ne pabaiga ir planuojamas antrasis projektas „Liepa2“ lietuviškai valdomo ir kalbančio kompiuterio galimybes dar labiau išplės. O užbaigti noriu „Microsoft“ kompanijos stratego Davido Brookso žodžiais: „Kalba, kuri nepasklis elektroninėje terpėje, greitai taps nevartojama“, tad džiugu, kad mūsų gimtajai kalbai tai jau negresia.“

Elena RINKEVIČIENĖ „ŪP“ korespondentė

Autorės nuotraukos

Rašinių ciklą iš dalies finansuoja Lietuvos kultūros tarybos administruojamas Kultūros rė­mimo fondas

UP Peržiūrėti visą numerį galite ČIA.

Dalintis

2023/01/30

Pieno kainų krizė Lietuvoje ir ateities tendencijos

VDU ŽŪA langas. Vytauto Didžiojo universiteto Žemės ūkio akademijos mokslininkų tribūnoje profesorė Astrida MICEIKIENĖ dalijasi įžvalgomis apie pieno kainų krizę: kiek ji susijusi su globalia rinka ir ką turėtume daryti?
2023/01/30

VMVT atstovui – tarptautinis pripažinimas

Valstybinės maisto ir veterinarijos tarnybos (VMVT) Skubios veiklos skyriaus vedėjas bei Lietuvos sveikatos mokslų universiteto (LSMU) Veterinarijos akademijos docentas dr. Marius Masiulis tapo Švedijos Karališkosios žemės ūkio ir mi...
2023/01/30

Santaros klinikose darbą pradėjo Pacientų taryba

VUL Santaros klinikos pakvietė aktyvius pacientų organizacijų atstovus bei piliečius ir subūrė Pacientų tarybą, kuri ligoninėje veiks kaip patariamasis organas, atstovaujantis Santaros klinikų pacientus ir jų artimuosius, teikiantis patarimus klin...
2023/01/30

Algimantas Raudonikis: dar širdyje ne sutema

Vienas žinomiausių visų laikų Lietuvos kompozitorių Algimantas Raudonikis šiais metais mini 89-ąjį savo gimtadienį. Nors amžius jau solidus, paklaustas, kaip jaučiasi, nesudvejoja: „dar širdyje ne sutema“. Šis gimt...
2023/01/30

Gripo sezonas įpusėjo: sergamumas nedidėja

Nacionalinis visuomenės sveikatos centras prie Sveikatos apsaugos ministerijos (NVSC) informuoja, kad bendras sergamumo gripu, ūminėmis viršutinių kvėpavimo takų infekcijomis (ŪVKTI) ir COVID-19 liga (koronaviruso infekcija) rodiklis per sa...
2023/01/30

Siūlo tobulinti atliekų prevencijos ir tvarkymo sistemą

Aplinkos ministerija siūlo stiprinti apmokestinamųjų gaminių, ypač padangų, taip pat alyvos, elektros ir elektroninės įrangos, baterijų ir akumuliatorių, pakuočių atliekų ir eksploatuoti netinkamų transporto priemonių gamintojų ir importuotojų ats...
2023/01/30

Pajamų stabilizavimo priemonė startuos atsinaujinusi ir dar palankesnė ūkininkams

Dėl klimato kaitos ir padidėjusių kainų svyravimų ūkininkai susiduria su vis didesnėmis žemės ūkio rizikomis. Jau šiemet žemdirbiai šioms rizikoms valdyti galės naudotis nauju instrumentu – pajamų stabilizavimo priemone. Žemės ...
2023/01/30

Užsieniečiams išduota mažiau leidimų dirbti

Užimtumo tarnyba (UT) įvertino trečiųjų šalių piliečių įdarbinimo mūsų šalyje statistiką. Skaičiai mažėjantys. Mažiausia užsieniečių dalis pageidauja dirbti žemės ūkyje.
2023/01/30

Atleistas prokuroras, Klaipėdoje vairavęs neblaivus

Generalinė prokurorė Nida Grunskienė atleido iš prokuroro pareigų Juozą Syką, ėjusį Klaipėdos apygardos prokuratūros Baudžiamojo persekiojimo skyriaus prokuroro pareigas.