teema: | Konversatsiooniagendi modelleerimine: eestikeelse dialoogi automaattöötluse teoreetilised ja rakenduslikud probleemid |
---|---|
tunnusnumber: | ETF5685 |
projekti tüüp: | Eesti Teadusfondi grant |
erialad: |
2.9. Süsteemitehnika ja infotehnoloogia 6.3. Keeleteadus |
seisund: | käimasolev |
asutus: | TÜ Matemaatika-informaatikateaduskond |
projekti juht: | Mare Koit |
kestus: | 01.01.2004 - 31.12.2007 |
kirjeldus: | Konversatsiooniagendi all mõistetakse arvutiprogrammi, mis osaleb dialoogis inimesega võrdväärse partnerina, kusjuures suhtlus toimub loomulikus keeles (meie juhul eesti keeles) ning inimestevahelise suhtluse normide ja reeglite kohaselt. Käesoleva projekti eesmärk on töötada välja erinevatele ainevaldkondadele (ostu-müügiinfo, teejuhatamine, liiklusinfo, reisiplaneerimine jms) häälestatava konversatsiooniagendi mudel ja realiseerida see eksperimentaalse dialoogsüsteemina, mis suhtleks kasutajaga eesti keeles (tekstisisendiga ning teksti- ja kõneväljundiga). Koostatav programm peab suutma arendada kasutajaga nn loomulikku dialoogi, s.t olema võimeline analüüsima kasutaja poolt sisestatavaid eestikeelseid lauseid, vajaduse korral esitama kasutajale täpsustavaid küsimusi ja vastuseks väljastama soovitud informatsiooni, kui see leidub andmebaasis. Programmis on kavas kasutada eesti keele jaoks olemasolevaid keeletehnoloogiamooduleid (morfoloogia, süntaks, semantika, ka tekst-kõnesüntees), neid vajalikul viisil integreerides ja modifitseerides. Projekti käigus laiendatakse eestikeelset dialoogikorpust, kogudes (lisaks praegu olemasolevatele infotelefoni- ja reisibüroodialoogidele) eestikeelsete vestluste lindistusi erinevatest valdkondadest, keskendudes seejuures infoandmis- ja läbirääkimisdialoogidele. Koostatakse dialoogikorpuse automaattöötlust hõlbustav tarkvarapakett, mis võimaldab vähendada ajamahukat käsitsitööd suuliste vestluste lindistuste litereerimisel ja märgendamisel, samuti teha mitmesugust statistikat korpuse tekstide kohta, mille alusel korpust teiste keelte dialoogikorpustega võrrelda. Dialoogikorpuses märgendatakse kõneaktid, eelnevalt koostatud aktitüpoloogiat kohandades ja laiendades. Analüüsitakse erinevate kõneaktitüüpide vormilist väljendamist eestikeelses suulises suhtluses. |
projektiga seotud isikud | ||||
---|---|---|---|---|
nr | nimi | asutus | amet | |
1. | Tiit Hennoste | Tartu Ülikool | teadur | |
2. | Mare Koit | TÜ Matemaatika-informaatikateaduskond | professor | |
3. | Tiit Roosmaa | Tartu Ülikool | dotsent | |
4. | Andriela Rääbis | Tartu Ülikool | teadur | |
5. | Haldur Õim | Tartu Ülikool | professor |