Tiedekunta/Osasto - Fakultet/Sektion
Laitos - Institution
Yleisen kielitieteen laitos/Englannin kielen laitos
Tekijä - Författare
Heikkilä, Juha
Työn nimi - Arbetets titel
A lexicon and feature system for automatic morphological analysis of English
Oppiaine - Läroämne
Yleinen kielitiede/Englantilainen filologia
Työn laji - Arbetets art
gradu
Aika - Datum
syyskuu 1991
Sivumäärä - Sidoantal
80 + 8
Tiivistelmä - Referat

Tutkielmassa käsitellään tietokonekäyttöisen leksikon ja siihen liittyvän piirresysteemin kehittämistä englannin kielen automaattista (tietokoneella tapahtuvaa) morfologista analysointia varten. Leksikko on osa laajempaa kokonaisuutta, joka on kehitetty kirjoitetun standardienglannin jäsentämistä varten. Työn teoreettisina puitteina ovat Koskenniemen kaksitasomalli ja Karlssonin rajoituskielioppi (Constraint Grammar).

Tutkielman alkuosassa esitellään lyhyesti Karlssonin Constraint Grammar, työn puitteet ja systeemin syntyhistoria. Tämän jälkeen siirrytään käsittelemään tutkittavan leksikon rakennetta ja sen eri osien funktioita. Leksikon rakenteen jälkeen esitellään sanaluokkaisesti englannin kielen kuvaukseen käytetty piirteistö ja sovelletut luokitteluperiaatteet. Johtoajatuksena on ollut informaation maksimoiminen ja monimielisyyden eli ambiguiteetin hyödyntäminen. Lisäksi kuvauksessa on pyritty hyvin pitkälle huomioimaan analyysin myöhempien vaiheiden vaatimukset. Tämän jälkeen esitellään joukko yksittäisiä ratkaisuja ja niiden perustelut. Erityisesti kiinnitetään huomiota tavallisuudesta poikkeaviin ratkaisuihin ja niiden motivaatioon. Käsiteltäviä asioita ovat kiinteät syntagmat (idiomit), yhdyssanat, numerus, suljetut sanaluokat, partisiipit, substantiivi-adjektiivi monimielisyydet ja johto-oppi. Tehdyt ratkaisut ovat käytännössä toimivia, mutta ongelmia tuodaan esille erityisesti yhdyssanojen osalta.

Esille otetaan myös joitain jäljellä olevia ongelmia. Esille tuodaan sekä piirreluokittelun puutteet että epäjohdonmukaisuudet sanaluokka-jaottelussa. Lyhyesti viitataan myös työtä vaikeuttaneisiin ulkoisiin rajoituksiin. Lisäksi pohditaan sitä, kuinka hyvin lähtöoletuksena ollut semantiikan poissulkeminen on onnistunut ja kuinka pitkälle semantiikka ylipäänsä on rajattavissa tutkimuksen ulkopuolelle. Lopuksi esitellään tulokset testeistä, jotka tehtiin leksikon kattavuuden mittaamiseksi. Materiaalina oli neljä ennen analysoimatonta tekstiä, kooltaan noin 4500-9500 sanaa.

Avainsanat - Nyckelord
Säilytyspaikka - Förvaringställe
Muita tietoja