WP1.1 Luonnollisen kielen jäsennys Moduuli 1 Staattinen varasto: Puheentunnistuksen leksikot (kielimallit) jäsennystä varten Miten taivutus otetaan huomioon kielimallissa? Ehkä luetteloimalla vartaloita ja päätteitä: (t,ö,ö,l,ö:Töölö), (ö,n:ILL) Valmiin kieliteknologian osuus: vartalo- ja pääteleksikoiden generointi sanaluetteloista ja/tai testilauseista Moduuli 2 Ohjelmamoduuli: Tokeniser (sanatason disambiguaatio) Staattinen varasto: Semanttinen leksikko, jossa sanat on määritelty tunnistuksen tarvitsemiin sanaluokkiin, esim. Töölö:N,PAIKKA Syöte: puheentunnistuksen tuloste, joka on... deterministinen arvaus segmentaatioksi, morfeemien tunnistustodennäköisyydet per segmentti (Töölö:0.5;hölmö:0.1),(ILL:0.7;GEN:0.3),... Tuloste: Semanttisesti tulkittujen morfeemien tunnistustodennäköisyydet (Töölö:N,PAIKKA,1.0),(ILL:0.9,GEN:0.1),... ... Moduuli 3 Ohjelmamoduuli: Chunker (lausekkeentunnistus) Staattinen varasto: kielioppi Syöte: Semanttisesti tulkittujen morfeemien tunnistustodennäköisyydet (Töölö:N,PAIKKA:1.0),(ILL:0.9,GEN:0.1),... Tuloste: Lausekkeentunnistus todennäköisyyksillä (jäsennystaulukko?): ([(Töölö:N,PAIKKA:1.0),(ILL:1.0)]:NP,GOAL:0.8), .... ------------------ end of HY? Moduuli k+1: Ohjelmamoduuli: Anaforien, ellipsien ja fragmenttien täydennys Syöte: 1. Lausekkeentunnistus todennäköisyyksillä, anaforit merkitty ja luokitettu ([(entä:KONJUNKTIO,KYSYMYS:1.0),(huomenna:1.0)]:NP,AIKA:0.8), .... 2. Dialogihistoria Tuloste: Täydennetty käsiteanalyysi, joka on muotoa... (Kysymys=milloin:0.9,Kysymys=millä:0.1),(Goal=Töölö:0.7,Agentti=hölmö:0.2) Moduuli k+2: Staattinen varasto: Aihealakohtainen semanttinen tieto (tietokannan käsiterakenne) Syöte: Lausekkeentunnistus todennäköisyyksillä (jäsennystaulukko): ([(Töölö:N,PAIKKA:1.0),(ILL:1.0)]:NP,GOAL:0.8), .... Tuloste: Käsiteanalyysi, joka on muotoa... (Kysymys=AIKA:0.9,Kysymys=VÄLINE:0.1),(Goal=Töölö:N,PAIKKA:0.7,Agentti=hölmö:0.2) ... Moduuli n: (TaY) Kyselyn generointi (select ....