Morfologinen analysaattori pseudokielelle X

Kielen X vokaalit ovat a, e, i, o ja u. Konsonantteja kielessä ovat p, m, t, n, k ja äng-äänne. Kirjoitetussa kielessä kutakin äännettä vastaa sama kirjain kuin suomessa, äng-äänne kirjoitetaan n-kirjaimella, eli n-kirjain tarkoittaa joko n- tai äng-äännettä. (Aivan kuten suomessakin, "np" on siis laiton ja "nk" ja "nt" ovat laillisia äännepareja.) Kaksi samaa konsonanttia tarkoittaa pitkää äännettä kuten suomessakin.

Kieli on hyvin säännöllinen: Sekä konsonantteja että vokaaleja voi olla korkeintaan kaksi kirjoitettuna peräkkäin (eli yksi pitkä äänne tai kaksi lyhyttä). CCC- (C=konsonantti) ja VVV-jonot (V=vokaali) ovat siis laittomia. Lisäksi nasaali ei koskaan seuraa klusiilia ja konsonanttiryppäässä voi muutenkin olla vain saman artikulaatiopaikan konsonantteja, siis bilabiaalisia, alveolaarisia tai velaarisia.

Lisäksi kielessä on tiukka vokaaliharmonia. Äänteistä a on neutraali ja voi esiintyä kaikkien muiden äänteiden kanssa, mutta etiset e ja i eivät voi esiintyä samassa sanassa takaisten u:n ja o:n kanssa. Kieli on vahvasti agglunoiva, eli morfeemien liittäminen sanan vartaloon ei aiheuta äännemuutoksia. Substantiivin vartalo päättyy aina vokaaliin. Morfeemit liittyvät substantiiviin samalla tapaa kuin suomessa ensin luku, sitten sija. Morfeemit ja niiden tunnukset ovat listattuna alla. Huomaa, että yksikkö on tunnusmerkitön.

MorfeemiTunnus
SG (eli yksikkö) 
PL (eli monikko)-ta
MorfeemiTunnus
NOM (eli nominatiivi)-n
GEN (eli genetiivi)-ma
DAT (eli datiivi)-t
ACC (eli akkusatiivi)-tat

Tee morfologinen analysaattori, joka saa syötteenään sana/rivi-muotoista tekstiä. Ohjelmasi antaa kullekin sanalle morfologisen tulkinnan, jos sellainen on. Tulkinnattoman sanan yhteydessä ei tarvitse tulostaa mitään. Sanat voivat olla myös moniselitteisiä. Yritä saada ohjelmasi tulostamaan tällaiselle sanalle kaikki tulkinnat, sillä puuttuvista tulkinnoista sakotetaan... Tulkinta esitetään muodossa:

   PINTAMUOTO = VARTALO LUKU SIJA
  

Esimerkiksi muoto kakuma tulostaisi siis tulkinnan

   kakuma = kaku SG GEN
  

Tunnistamatonta sanaa ei tarvitse kirjoittaa ollenkaan. Moniselitteisen sanan pimetat tulostus oli allaoleva (rivit tosin saattavat tulla käänteisessä järjestyksessä).

   pimetat = pimeta SG DAT
   pimetat = pime PL DAT
   pimetat = pime SG ACC
  

IPA:n äännekartta niille, jotka tarvitsevat tietoa artikulaatiopaikoista.

Palautuksesta: sähköpostitse luennoitsijalle 15.3. mennessä. Monitulkintaisuudesta voi aina kysyä. Tehkää työ huolellisesti kaikkine pikku detaljeineen. Työ ei ole kauhean vaikea, joten rokotan virheistä/puutteista aika surutta...


Nicholas Volk
Viimeksi päivitetty: Monday, 10-Mar-2003 09:48:09 EET