Ashburn +3,2 °C Dangus giedras
Penktadienis, 29 Kov 2024
Ashburn +3,2 °C Dangus giedras
Penktadienis, 29 Kov 2024

Mokslininkai kompiuterius prakalbino lietuviškai

2015/10/24


Prof. Laimutis Telksnys įsitikinęs, jog pagaliau atvertos galimybės moksleiviams, suaugusiesiems, neįgaliesiems naudoti lietuviškai suprantančius ir lietuviškai šnekančius kompiuterius.

KAIP NEPASIKLYSTI ŠIUOLAIKINIŲ MEDIJŲ PLATUMOSE?

Visai neseniai apie balsu valdomą kompiuterį žinojome tik iš mokslinės fantastikos kūrinių, o šiandien tai daryti jau galima net ir kalbant lietuviškai. Galvoje turime ne karinę pramonę ar kitas aukštųjų technologijų kūrimo bei naudojimo sritis, o kasdienius mūsų palydovus: stacionarius, nešiojamuosius ar planšetinius kompiuterius, išmaniuosius mobiliuosius telefonus, išmaniuosius laikrodžius ir kitus technologiškai pažangius daiktus, kuriais galima dirbti valdant juos kalba. Su dauguma tokių prietaisų susikalbėti galima, deja, nelietuviškai. Tačiau padėtis iš esmės jau keičiasi, nes 2013–2015 metais Vilniaus universiteto Matematikos ir informatikos instituto (VU MII) mokslininkai, pasitelkę į pagalbą Lietuvos kalbos instituto (LKI), Lietuvos edukologijos (LEU) bei Šiaulių universitetų (ŠU) specialistus, įvykdė projektą, kurio metu sukurtos septynios lietuvių kalba valdomos paslaugos. Vadinasi, moksleiviai, suaugusieji, neįgalieji, verslininkai, ūkininkai, žodžiu, visi, kam tai aktualu, gali naudoti lietuvių kalbą suprantančius ir ja kalbančius kompiuterius. Apie projekto „Liepa“ metu vykusius darbus, sukurto galutinio produkto naudą bei atsiveriančias galimybes papasakojo projekto vadovas VU MII Atpažinimo procesų skyriaus afilijuotasis vyriausiasis mokslo darbuotojas prof. Laimutis Telksnys ir to paties skyriaus specialistas Gediminas Navickas.

Nuo idėjos iki fakto – penkiasdešimt metų Pasak prof. L. Telksnio, idėja valdyti kompiuterį balsu kilo prieš pusę amžiaus. „Tuomet buvau tik pradėjęs dirbti skaičiavimo technikos srityje. Tačiau to meto problema buvo tai, kad skaičiavimo mašinos skaičiavo jau gana greitai, bet pateikti joms duomenis buvo labai sudėtinga ir viskas vyko labai lėtai. Šiandien viską surenkame naudodamiesi kompiuterio klaviatūra, o anuomet buvo naudojamos perfokortos. Jas turėtų prisiminti vyresnės kartos žmonės, susidūrę su to meto kompiuteriais. Jau tada galvoje kirbėjo mintis, kaip šį procesą supaprastinti iki komandų skaičiavimo mašinai davimo balsu. Kodėl šis procesas užtruko gana ilgai? Visgi kompiuteriai nebuvo tokie tobuli, kad tuomet būtų buvę įmanoma padaryti tai, ko pasiekėme šiandien. Kai viskas jau padaryta, regis, viskas gana paprasta, bet toli gražu taip nėra. Kalbos atpažinimo procesas yra sudėtingas dalykas. Kiek­viena kalba yra labai specifinė, o lietuvių pasižymi ir dideliu, pavadinkime, lankstumu. Pavyzdžiui, skirtingai sukirčiavus žodį kaltas, gaunamos visiškai skirtingos reikšmės. O sakinių struktūros sudarymas dar sudėtingesnis. Todėl tam, kad kompiuteris skirtų labai subtilius lietuvių kalbos niuansus, reikėjo rimtai padirbėti. Kalbos signalai aprašomi skaitmeninėmis lygtimis ir pagal kitus požymius, bet to vis tiek neužtenka. Norint, kad mašina atpažintų, kas jai sakoma ir kad ji pati taisyklingai kalbėtų, reikia šnekos pavyzdžių. Čia labai svarbios ir kalba perduodamos emocijos. Mums bendraujant tarpusavyje viskas atrodo paprasta, bet mašinai jas atpažinti labai sudėtinga, – sakė profesorius. – Nepaisant to, kad daug metų nuolat buvo vykdomi įvairūs eksperimentai, tik prieš dešimtmetį prasidėjo tikrai sistemingi tyrimai šioje srityje. O prieš trejus metus, kai atsirado galimybė pasinaudoti Europos Sąjungos parama, darbai pajudėjo iš esmės kryptingai, kad tiriamųjų darbų rezultatas taptų visiems prieinamomis paslaugomis. 2012 m. pradėtas vykdyti projektas „Liepa“ – lietuvių šneka valdomos paslaugos, šiandien jau baigtas.

Laukia siūlymų, ką tobulinti „Pradėję šį projektą iš karto teigėme, kad visiškai pasinaudoti užsienio patirtimi neįmanoma. Reikėjo suvienyti fundamentalias lietuvių kalbininkų ir informatikos specialistų žinias. Ši sąsaja – visa ko esmė, o galutinis geidžiamas rezultatas – galimybę lietuviškai valdyti kompiuterius suteikti kuo didesnei visuomenės daliai. Pirma, norėjome, kad su šiomis paslaugomis kuo plačiau susipažintų moksleiviai. Jiems sukurtos dvi priemonės: biologijos pamokoms skirta skaitmeninė mokomoji priemonė, leidžianti inovatyviai aiškintis ląstelės sandarą ir su ląstele susijusius procesus, bei geografijos pamokoms skirta priemonė, leidžianti mokiniams praplėsti akiratį skaitant, peržiūrint, išklausant priemonės kūrėjų sukauptą pažintinę medžiagą. Mums labai svarbu dar ir tai, kad naudotojai įvertintų priemonių naudingumą, funkcionalumą ir siūlytų, ką dar reikėtų tobulinti. Noriu ypač pabrėžti tai, kad mūsų sukurtos paslaugos yra visiems atviros ir nemokamos. Visą informaciją galima rasti interneto svetainėje liepa.raštija.lt. Kai kuriose pozicijose reikalinga registracija, bet visu mūsų kūriniu gali naudotis absoliučiai kiekvienas to norintis“, – tvirtino prof. L. Telksnys. Gediminas Navickas sakė, jog projekto pagrindinis tikslas – rezultatus pateikti prieinamus visiems: „Ir ne tik laisvai naudotis sukurtomis paslaugomis, bet, kaip jau minėjo profesorius, galima prisidėti prie jų tobulinimo, t. y. tie, kurie domisi atpažintuvų, elektroninio teksto skaitytuvų galimybėmis, gali gauti jų programinį kodą ir laisvai naudoti jį kurdami naujus produktus bei paslaugas, turinčias lietuvių šnekos atpažinimo ir sintezės funkcijas.“

Naujos galimybės neįgaliesiems Pasak prof. L. Telksnio, lietuviškai kompiuterį prakalbinti labai padėjo bendradarbiavimas su turinčiaisiais regėjimo negalią. „Juk daugeliui gali kilti klausimas, kaip aklas žmogus gali dirbti kompiuteriu? Pasirodo, kad aklieji puikiai išmoksta naudotis įprastine kompiuterio klaviatūra, o naudojant mūsų sukurtą paslaugą, informaciją, kurią mes matome ekrane, jiems balsu perskaito kompiuterinis sintezatorius. Žinoma, dar reikalingos specialios ekrano skaitymo programos, kurios paima informaciją iš ekrano ir perduoda sintezatoriui. O, pavyzdžiui, paslauga „Naršytuvas“ gali visiškai pakeisti įprastines naršymo sąsajos priemones – pelę ir klaviatūrą, todėl gali būti panaudota tiek kaip speciali priemonė didelę fizinę negalią turintiems asmenims, tiek kaip alternatyvi naršymo priemonė visiems naudotojams.“ G. Navicko teigimu, dar viena sukurta paslauga ypač verta dėmesio – „Pagalbininkas“. „Ji padeda mokytis lietuvių kalbos ir lavinti socialinius įgūdžius. „Pagalbininkas“ siūlo išgirsti visus lietuvių kalbos abėcėlės garsus, dvigarsius ir dvibalsius bei 300 žodžių, kuriuose šie garsai girdimi. Be to, paslauga siūlo vartotojui sudalyvauti keturiose bendravimo situacijose, kurios dažniausiai pasitaiko gyvenime. Tai socialiniai kontekstai: „Aš ir kiti“, „Pas gydytoją“, „Kavinė“, „Parduotuvė“. Vartotojas gali rinktis bet kurį animuotą personažą iš keturių siūlomų. Šie sudaro galimybę vartotojui išbandyti įvairius vaidmenis, o padarius klaidą, „Pagalbininkas“ pasiūlo rinktis vieną iš keturių pagalbos rūšių: pakartoti visą pamirštą frazę, paimti vieną raktinį žodį, parodyti frazę su sumaišyta žodžių seka arba frazę, neatitinkančią socialinio konteksto prasmės“, – aiškino G. Navickas.

Kalba taisyklingai ir maloniu tembru Anot G. Navicko, keturios sukurtos paslaugos yra pasiekiamos tiesiog internetu, o trys – diegiamos į kompiuterį: „Jeigu vartotojas nori ką nors kurti pats, mūsų siūlomi pagrindiniai produktai jam tokią galimybę suteikia. Šnekant populiariai, jeigu kažkas pasigamina mašinos kėbulą, variklį ir vidaus įrangą mes tiesiog duodame nemokamai. Žinoma, tam tikrus programavimo pagrindus reikia turėti.“ Prof. L. Telksnys įsitikinęs, kad kalbantį kompiuterį girdėti teko daugeliui. Tačiau kompiuteris, kuris geba perskaityti tekstą taisyklinga lietuvių kalba ir ausiai maloniu bei priimtinu balsu, turėtų būti labai intriguojanti naujovė. „Būtent projekte „Liepa“ pavyko kompiuterį prakalbinti lietuviškai, be to, kompiuterio balsą jau sunku atskirti nuo gyvo žmogaus balso. Tai pasiekėme panaudoję naują šnekos sintezės metodą, kurio esmė yra rasti diktoriaus balso įrašų bazėje kuo ilgesnius tinkamus fragmentus ir iš jų „suklijuoti“ naują įrašą, idealiu atveju galima rasti visą įrašytą sakinį, bet dažniausiai randami žodžiai, žodžio dalys, skiemenys, blogiausiu atveju „klijuojama“ iš atskirų garsų. Taigi kompiuteris kalba keturiais balsais: vyriškais ir moteriškais, jaunais ir solidžiais. Garsų bazių apimtis po 5 tūkst. sakinių, o tai yra apie 160 tūkst. garsų arba 3,5 val. įrašo. Kartu su įrašais saugoma ir jų transkripcija, pagal kurią ir atliekama paieška. Prieš atliekant paiešką kompiuteriu tenka įveikti ir lietuvių kalbos fonologijos, morfologijos ir akcentologijos džiungles, kol iš teksto išgaunama transkripcija, – rišlios ir gražios kompiuterio lietuvių šnekos paslaptis aiškino prof. L. Telksnys. – Mūsų įvykdyto projekto tikslas – atverti kelią lietuvių kalbai į elektroninę erdvę – pasiektas, tačiau tai tikrai ne pabaiga ir planuojamas antrasis projektas „Liepa2“ lietuviškai valdomo ir kalbančio kompiuterio galimybes dar labiau išplės. O užbaigti noriu „Microsoft“ kompanijos stratego Davido Brookso žodžiais: „Kalba, kuri nepasklis elektroninėje terpėje, greitai taps nevartojama“, tad džiugu, kad mūsų gimtajai kalbai tai jau negresia.“

Elena RINKEVIČIENĖ „ŪP“ korespondentė

Autorės nuotraukos

Rašinių ciklą iš dalies finansuoja Lietuvos kultūros tarybos administruojamas Kultūros rė­mimo fondas

UP Peržiūrėti visą numerį galite ČIA.

Dalintis
2024/03/29

Valstybės abejingumo girnos traiško pieno ūkius

Pernai Lietuvos pieno ūkis atsidūrė ant prarajos krašto ir bet kurią akimirką gali į ją nugarmėti, nes pieno supirkimo kainos kaip mažėjo, taip ir toliau mažėja. Tokia lemtis gali ištikti ir visą Lietuvos žemės ūkį, jei valstybė jo n...
2024/03/29

Prokurorai išyrė Kretingos rajono politikų teiktus čekius

Šiandien Klaipėdos apygardos prokuratūros Viešojo intereso gynimo skyriaus prokurorai kreipėsi į teismą su dviem civiliniais ieškiniais dėl bendrai daugiau nei 22 tūkst. eurų, kaip nepagrįstai išmokėtų buvusiems Kreting...
2024/03/29

Pajamų deklaravimas: į ką atkreipti dėmesį pernai pardavus NT?

Valstybinė mokesčių inspekcija (VMI) primena, kad pernai nekilnojamąjį turtą (NT) pardavę gyventojai iki gegužės 2 d. turi įsivertinti, ar dėl šių sandorių jiems neatsirado pareiga pateikti pajamų mokesčio deklaraciją bei sumokėti gyventojų...
2024/03/29

Specialisto akimis: gero skonio midų pagaminti sunkiau nei vyną

Daugelis lietuviškų pasakų baigiasi žodžiais: „Alų midų gėriau, per barzdą varvėjo...“ Deja, priešingai nei anksčiau, midus dabar nėra toks populiarus kaip alus. Galbūt dėl to, kad trūksta žinių ar galimybės paragauti tik...
2024/03/29

Mokslininkai sutelkė dėmesį į gyvūnų elgesį

Rūpestingi šeimininkai netrunka pastebėti pasikeitusį augintinio elgesį. Veterinarijos specialistai ir mokslininkai perspėja, kad nereikėtų to praleisti pro akis, o atlikti naujausi moksliniai tyrimai tik patvirtina, kad socialinis š...
2024/03/29

Nuo balandžio 2 d. VVG kviečiamos kreiptis dėl paramos sumaniesiems kaimams

Nuo balandžio 2 d. iki gegužės 31 d. šalies vietos veiklos grupės (VVG) galės teikti Nacionalinei mokėjimo agentūrai (NMA) sumaniųjų kaimų strategijas pagal Lietuvos žemės ūkio ir kaimo plėtros 2023–2027 metų strateginio plano (SP) in...
2024/03/29

Devyni politikai VRK pateikė būtiną rinkėjų parašų skaičių, trims nepavyko

Devyni politikai Vyriausiajai rinkimų komisijai (VRK) pristatė privalomą rinkėjų parašų skaičių, norint dalyvauti prezidento rinkimuose.
2024/03/28

Įdomūs faktai apie augalų veislių selekcijos procesą

Augalų selekcija – mokslas, reikalaujantis kūrybiškumo, žinių, ir, žinoma, laiko. Lietuvos agrarinių ir miškų mokslų centro (LAMMC) mokslininkams uždavėme keletą klausimų apie augalų selekcijos procesą.
2024/03/28

Pasiūlė įsigyti saulės modulius – gautus pinigus pralošė

Kauno apylinkės teismo Kauno rūmuose bus pradėta nagrinėti baudžiamoji byla, kurioje marijampolietis kaltinamas dėl apgaule įgyto didelės vertės svetimo turto.