teema: Konversatsiooniagendi modelleerimine: eestikeelse dialoogi automaattöötluse teoreetilised ja rakenduslikud probleemid
tunnusnumber: ETF5685
projekti tüüp: Eesti Teadusfondi grant
erialad: 2.9. Süsteemitehnika ja infotehnoloogia
6.3. Keeleteadus
seisund: käimasolev
asutus: TÜ Matemaatika-informaatikateaduskond
projekti juht: Mare Koit
kestus: 01.01.2004 - 31.12.2007
kirjeldus: Konversatsiooniagendi all mõistetakse arvutiprogrammi, mis osaleb dialoogis inimesega võrdväärse partnerina, kusjuures suhtlus toimub loomulikus keeles (meie juhul eesti keeles) ning inimestevahelise suhtluse normide ja reeglite kohaselt.
Käesoleva projekti eesmärk on töötada välja erinevatele ainevaldkondadele (ostu-müügiinfo, teejuhatamine, liiklusinfo, reisiplaneerimine jms) häälestatava konversatsiooniagendi mudel ja realiseerida see eksperimentaalse dialoogsüsteemina, mis suhtleks kasutajaga eesti keeles (tekstisisendiga ning teksti- ja kõneväljundiga). Koostatav programm peab suutma arendada kasutajaga nn loomulikku dialoogi, s.t olema võimeline analüüsima kasutaja poolt sisestatavaid eestikeelseid lauseid, vajaduse korral esitama kasutajale täpsustavaid küsimusi ja vastuseks väljastama soovitud informatsiooni, kui see leidub andmebaasis. Programmis on kavas kasutada eesti keele jaoks olemasolevaid keeletehnoloogiamooduleid (morfoloogia, süntaks, semantika, ka tekst-kõnesüntees), neid vajalikul viisil integreerides ja modifitseerides.
Projekti käigus laiendatakse eestikeelset dialoogikorpust, kogudes (lisaks praegu olemasolevatele infotelefoni- ja reisibüroodialoogidele) eestikeelsete vestluste lindistusi erinevatest valdkondadest, keskendudes seejuures infoandmis- ja läbirääkimisdialoogidele. Koostatakse dialoogikorpuse automaattöötlust hõlbustav tarkvarapakett, mis võimaldab vähendada ajamahukat käsitsitööd suuliste vestluste lindistuste litereerimisel ja märgendamisel, samuti teha mitmesugust statistikat korpuse tekstide kohta, mille alusel korpust teiste keelte dialoogikorpustega võrrelda.
Dialoogikorpuses märgendatakse kõneaktid, eelnevalt koostatud aktitüpoloogiat kohandades ja laiendades. Analüüsitakse erinevate kõneaktitüüpide vormilist väljendamist eestikeelses suulises suhtluses.

projektiga seotud isikud
nr nimi asutus amet  
1.Tiit HennosteTartu Ülikoolteadur 
2.Mare KoitTÜ Matemaatika-informaatikateaduskondprofessor 
3.Tiit RoosmaaTartu Ülikooldotsent 
4.Andriela RääbisTartu Ülikoolteadur 
5.Haldur ÕimTartu Ülikoolprofessor