ALKUPERÄINEN EHDOTUS: WP1 Luonnollisella kielellä tapahtuva interaktio WP1.1. Robusti jäsennys Robusti lauseenjäsennys Merkitysanalyysi sanatasolla Analyysivirheet tunnistustasolla ellipsien ja fragmenttien järkevä käsittely Prosodian vaikutus puheen tunnistukseen WP1.2. Joustava kielentuotto Robusti generointi Tuotossa sanojen ja lauserakenteen valinta Uuden ja vanhan tiedon huomioon ottaminen Prosodian vaikutus puheen tuottoon (Kommentit: Työpakkaukseen ei kuulu interaktio. Puheentunnistus ei anna prosodiaa ) UUSI EHDOTUS: WP1 Luonnollisen kielen jäsennys ja tuottaminen WP1.1. Luonnollisen kielen jäsennys Puheentunnistuksen leksikot jäsennystä varten Sanatason disambiguaatio Lausekkeentunnistus Anaforien, ellipsien ja fragmenttien täydennys (osaksi) WP1.2. Luonnollisen kielen tuottaminen Lausekerakenteen generointi semanttisesta esityksestä Puhesynteesin syötteen generointi lausekerakenteesta UUDEN EHDOTUKSEN MUKAISET MODUULIT: WP1 Luonnollisen kielen jäsennys ja tuottaminen WP1.1 Luonnollisen kielen jäsennys ja tuottaminen Moduuli 1 Staattinen varasto: Puheentunnistuksen leksikot (kielimallit) jäsennystä varten Miten taivutus otetaan huomioon kielimallissa? Ehkä luetteloimalla vartaloita ja päätteitä: (t,ö,ö,l,ö:Töölö), (ö,n:ILL) Valmiin kieliteknologian osuus: vartalo- ja pääteleksikoiden generointi sanaluetteloista ja/tai testilauseista Moduuli 2 Ohjelmamoduuli: Tokeniser (sanatason disambiguaatio) Staattinen varasto: Semanttinen leksikko, jossa sanat on määritelty tunnistuksen tarvitsemiin sanaluokkiin, esim. Töölö:N,PAIKKA Syöte: puheentunnistuksen tuloste, joka on... deterministinen arvaus segmentaatioksi, morfeemien tunnistustodennäköisyydet per segmentti (Töölö:0.5;hölmö:0.1),(ILL:0.7;GEN:0.3),... Tuloste: Semanttisesti tulkittujen morfeemien tunnistustodennäköisyydet (Töölö:N,PAIKKA,1.0),(ILL:0.9,GEN:0.1),... ... Moduuli 3 Ohjelmamoduuli: Chunker (lausekkeentunnistus) Staattinen varasto: kielioppi Syöte: Semanttisesti tulkittujen morfeemien tunnistustodennäköisyydet (Töölö:N,PAIKKA:1.0),(ILL:0.9,GEN:0.1),... Tuloste: Lausekkeentunnistus todennäköisyyksillä (jäsennystaulukko?): ([(Töölö:N,PAIKKA:1.0),(ILL:1.0)]:NP,GOAL:0.8), .... ------------------ end of HY? Moduuli k+1: Ohjelmamoduuli: Anaforien, ellipsien ja fragmenttien täydennys Syöte: 1. Lausekkeentunnistus todennäköisyyksillä, anaforit merkitty ja luokitettu ([(entä:KONJUNKTIO,KYSYMYS:1.0),(huomenna:1.0)]:NP,AIKA:0.8), .... 2. Dialogihistoria Tuloste: Täydennetty käsiteanalyysi, joka on muotoa... (Kysymys=milloin:0.9,Kysymys=millä:0.1),(Goal=Töölö:0.7,Agentti=hölmö:0.2) Moduuli k+2: Staattinen varasto: Aihealakohtainen semanttinen tieto (tietokannan käsiterakenne) Syöte: Lausekkeentunnistus todennäköisyyksillä (jäsennystaulukko): ([(Töölö:N,PAIKKA:1.0),(ILL:1.0)]:NP,GOAL:0.8), .... Tuloste: Käsiteanalyysi, joka on muotoa... (Kysymys=AIKA:0.9,Kysymys=VÄLINE:0.1),(Goal=Töölö:N,PAIKKA:0.7,Agentti=hölmö:0.2) ... Moduuli n: (TaY) Kyselyn generointi (select .... WP1.2. Luonnollisen kielen tuottaminen Moduuli 1 Ohjelmamoduuli: Lausekerakenteen generointi Staattinen varasto: Semanttinen leksikko Generointikielioppi Syöte: Käsiteanalyysi, joka on muotoa... (Kysymys=AIKA:UUSI),(Agent=user:VANHA),(Action=GO:VANHA)(Goal=Töölö:N,PAIKKA)... Tuloste: Lausekerakenne, joka on jonkinlainen puu tyyppiä ((Milloin)ADV ((bussi)SUBJ (17)NUM)NP ... ) Moduuli 2 Ohjelmamoduuli: puhesynteesin syötteen generointi Syöte: Lausekerakenne, joka on jonkinlainen puu tyyppiä ((Milloin)ADV:UUSI ((bussi)SUBJ:VANHA (17)NUM)NP:KONTRASTIIVINEN ... ) Tuloste: Puhesyntetisaattoriin kelpaava parametrijono