Tiedekunta/Osasto - Fakultet/Sektion
Humanistinen tiedekunta
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Miikka-Markus Alhonen
Työn nimi - Arbetets titel
Literary Ottoman Turkish as a Contact Language
Oppiaine - Läroämne
Yleinen kielitiede
Työn laji - Arbetets art
pro gradu -tutkielma
Aika - Datum
maaliskuu 2005
Sivumäärä - Sidoantal
91
Tiivistelmä - Referat

Tämä työ käsittelee Osmanien valtakunnassa virallisena kielenä käytettyä osmaniturkin kirjakieltä viimeaikaisen kontaktilingvistisen tutkimuksen valossa. Kieltä on usein kuvattu luonteeltaan sekoittuneeksi, sillä suurin osa sen käyttämästä sanastosta on persialaista tai arabialaista alkuperää, vaikka kieliopillisen aineksen perusteella kieli on selvästi turkkilainen. Tutkielmassa esitän lähtökielten sanastollisenkin jakauman olevan dikotominen: osmaniturkin substantiivit, adjektiivit ja konjunktiot ovat säännönmukaisesti arabialaisia tai persialaisia, kun taas verbit ja pienemmät suljetut luokat (pronominit, numeraalit ja adpositiot) ovat turkkilaisia. Lisäksi sekä nominien että verbien taivutuspäätteet ovat suurimmaksi osaksi turkkilaista alkuperää.

Tarkastelen tutkielmassa useita kontaktilingvistisiä ilmiöitä kuten lainautumista, kielenvaihtoa, koodinvaihtoa ja pidginisaatiota sekä pyrin löytämään teorioita, jotka selittäisivät osmaniturkin synnyn ja rakentellisen poikkeuksellisuuden. Erityinen painopiste työssä on 1990-luvun alussa alkaneen, edelleen nopeasti kehittyvän sekakielitutkimuksen tarkastelu. Maailmassa tiedetään olevan ainakin joitakin kymmeniä kieliä, joita ei ole helppo luokitella mihinkään kieliryhmään kuuluvaksi, sillä etymologisesti niiden kieliopin lähde on eri kuin sanaston. Joissakin kielissä kahtiajako on pitkälti osmaniturkin tapaan verbien ja substantiivien lähtökohdan välillä. Sekakielten syntyprosessia on monasti esitetty omaksi mekanismikseen, joka tulee teoreettisella tasolla erottaa tavanomaisemmista kielikontakti-ilmiöistä.

Tutkielmassa esittelen osmaniturkin kieliopillista ja sanastollista rakennetta empiirisen aineiston pohjalta. Tekstikorpuksena olen käyttänyt 1500- ja 1600-luvuilla käytyä osmanihallitsijoiden ja keskiaasialaisten kaanikuntien välistä virallista kirjeenvaihtoa. Lisäksi esittelen sosiaalisen ja sosiolingvistisen kontekstin, jossa osmaniturkki syntyi ja kehittyi. Nämä yhdistämällä pyrin selvittämään kielen sijoittumisen toistaiseksi tunnettuihin kielikontaktiteorioihin nähden

Avainsanat - Nyckelord
osmaniturkin kieli, kielikontaktit, sekakielet
Säilytyspaikka - Förvaringställe
Muita tietoja

Tiedekunta/Osasto - Fakultet/Sektion
Humanistinen tiedekunta
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Jyrki Niemi
Työn nimi - Arbetets titel
Kalenteriajanilmausten semantiikka ja generointi: semantiikan mallintaminen laajennettuina säännöllisinä lausekkeina ja luonnollisen kielen generointi lausekkeista XSLT-muunnoksilla
Oppiaine - Läroämne
Kieliteknologia
Työn laji - Arbetets art
pro gradu -tutkielma
Aika - Datum
marraskuu 2004
Sivumäärä - Sidoantal
10 + 168 + liiteet 54 + CD-tietolevy
Tiivistelmä - Referat

Tutkielman tarkoituksena on tutkia luonnolliskielisten kalenteriajanilmausten sisältämiä rakenteita ja laajennettujen säännöllisten lausekkeiden soveltuvuutta niiden semantiikan esittämiseen. Tätä esitysmuotoa kokeillaan tutkielmassa ajanilmausten XSLT-pohjaisen generoinnin lähtömuotona.

Tutkielma esittelee ajanilmausten rakenteita WWW-sivuilta kerätyn suomen- ja englanninkielisiä ilmauksia sisältävän aineiston pohjalta. Tutkielma käsittelee lähinnä kalenteriajanilmauksia, jotka eivät sisällä viittauksia puhehetkeen tai ilmauksessa mainitsemattomaan viitehetkeen.

Kalenteriajanilmausten rakenteiden semantiikkaa mallinnetaan laajennettujen säännöllisten lausekkeiden rakenteilla, joissa käytetään leikkausta, komplementtia ja säännöllisten relaatioiden (äärellisten transduktorien) avulla määriteltyjä operaatioita sekä näitä operaatioita käyttäviä makroja. Ajanilmausten kuvaaminen säännöllisillä lausekkeilla perustuu malliin, jossa aikasuora kuvataan merkkijonona ja ajanilmausten merkitys tämän merkkijonon osajonojen joukkoina.

Tutkielma esittelee ajanilmausten säännöllisiin lausekkeisiin perustuvan päättelyn perusperiaatteita. Päättelyllä voi tutkia esimerkiksi kahden ajanilmauksen tarkoittamien aikojen sisältyvyyssuhdetta. Päättelyyn on kokeiltu äärellisiin automaatteihin perustuvaa mallintarkastamista ja alustavasti termien toisinkirjoittamista.

Generoinnista tutkielma esittelee prototyypin, joka tuottaa ajanilmauksen säännöllisestä lausekkeesta vastaavan luonnolliskielisen ilmauksen. Generointijärjestelmä on toteutettu peräkkäisinä XSLT-muunnoksina. Sen ensimmäinen päävaihe tuottaa säännöllisestä lausekkeesta XML-muotoisten generointisääntöjen perusteella dependenssipiirrerakenteen, josta toinen päävaihe tuottaa lopullisen tekstimuodon. Prototyyppi tuottaa suomen- ja englanninkielisiä ilmauksia.

Laajennetut säännölliset lausekkeet soveltuivat kuvaamaan useimpia käsitellyistä kalenteriajanilmausten rakenteista, mutta epäjatkuvia aikoja tarkoittavia rakenteita. Kuvaamatta jäivät kuitenkin esimerkiksi epätäsmälliset ajanilmaukset ja murto-osailmaukset. Esitetyt ajanilmausten säännölliset lausekkeet ovat suureksi osaksi kompositionaalisia. Koska säännöllisten lausekkeiden rakenteet ovat lähellä vastaavien luonnolliskielisten ajanilmausten rakenteita, ajanilmaukset pystyi generoimaan säännöllisistä lausekkeista melko suoraviivaisesti XSLT-muunnoksilla.

Ajanilmausten säännöllisten lausekkeiden käytännön käyttökelpoisuuden kannalta olisi keskeistä kehittää päättelymenetelmä, joka olisi äärellisiä automaatteja tehokkaampi. Menetelmä voisi perustua termien toisinkirjoitukseen. Jatkotutkimus voisi myös selvittää esitysmuodon laajentamista kattamaan ulkopuolelle jääneitä ajanilmausten rakenteita sekä tapahtumia.

ACM Computing Classification System (1998): I.2.7 [Artificial Intelligence]: Natural Language Processing - language models, language generation

Avainsanat - Nyckelord
ajanilmaukset, säännölliset lausekkeet, luonnollisen kielen generointi, monikielisyys
Säilytyspaikka - Förvaringställe
Humanistisen tiedekunnan kirjasto
Muita tietoja

Tiedekunta/Osasto - Fakultet/Sektion
Humanistinen tiedekunta
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Mirkka Soininen
Työn nimi - Arbetets titel
Tekstin retorisen rakenteen tietokonepohjainen analysointi
Oppiaine - Läroämne
Kieliteknologia
Työn laji - Arbetets art
Pro gradu -tutkielma
Aika - Datum
16.6.2004
Sivumäärä - Sidoantal
98
Tiivistelmä - Referat

Tarkastelen tekstejä kokonaisuuksina ja diskurssia koossapitäviä konnektiiveja. Esittelen kolmea tekstianalyysiteoriaa: kertomusanalyysi (Labov ja Waletzky), matriisianalyysi (Hoye) sekä retorinen rakenneteoria (Mann ja Thompson). Havainnollistan metodien erilaisuutta analysoimalla Aisopoksen kertomuksen "Rakastunut leijona" kullakin tavalla. Teoriat eroavat toisistaan ja ne soveltuvat erityyppisten tekstien analysointiin.

Kokonaisten tekstien analysoimisesta siirryn kuvaamaan työkaluja, joilla kuvataan tekstiä pienempiä yksiköitä, tekstiyksiköitä. Esittelen kaksi työkalua: leksikaalinen puuliitoskielioppi jäsentää tekstit ja diskurssit sekä esittää ne puina. RST-työkalu helpottaa tekstin peruselementtien ja niiden välisten suhteiden merkitsemisessä.

Lopuksi tutkin, kuinka teksteistä voidaan erottaa tekstin analyysia varten sopivia tekstiyksiköitä käyttämällä olemassa olevaa syntaktista dependenssipohjaista lauseenjäsennintä (FDG). Apunani käytän Knottin laatimaa luetteloa konnektiiveista ja retorisiin yksiköihin jaettua esimerkkitekstimateriaalia. Luon säännöt, joiden avulla konnektiivit tunnistetaan dependenssianalyysistä.

Avainsanat - Nyckelord
retorinen rakenneteoria (RST), diskurssikonnektiivi, tekstikonnektiivi, funktionaalinen dependenssijäsennin (FGD), kertomusanalyysi, koherenssi, koheesio, konteksti, konnektiivi ja relaatio
Säilytyspaikka - Förvaringställe
Muita tietoja

Tiedekunta/Osasto - Fakultet/Sektion
Humanistinen tiedekunta
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Joona Hämäläinen
Työn nimi - Arbetets titel
Non-canonical marking of grammatical subjects
Oppiaine - Läroämne
Yleinen kielitiede
Työn laji - Arbetets art
Pro gradu -tutkielma
Aika - Datum
25.5.2005
Sivumäärä - Sidoantal
69
Tarkastajat
Ekaterina Gruzdeva, Orvokki Hämäläinen
Tiivistelmä - Referat

Ei-kanonisuudella tarkoitetaan tässä työssä poikkeavia tapoja merkitä lauseiden ydinargumentteja. Subjekti on perinteisessä kielitieteessä määritelty lähinnä muodollisiin seikkoihin kuten sijamerkintään ja kongruenssiin nojautuen. Ergatiivisuuden tultua tunnetuksi monet tutkijat ovat kyseenalaistaneet subjektiominaisuuksien yksioikoisen määrittelyn. On havaittu, että monissa kielissä ei olekaan yhtä ainoaa tapaa merkitä lauseen primaarista argumenttia.

Tässä työssä lähden liikkeelle siitä, että subjektin käsite ei ole määriteltävissä riittävien ja välttämättömien kriteerien avulla. Subjektius määrittyy luonnollisissa kielissä prototyyppisyyden pohjalta. Ei-kanoniset subjektit ovat epätyypillisiä argumentteja nimenomaan merkintänsä puolesta. Tällöin ei-kanonisesti merkityt subjektit eroavat muista epätyypillisistä argumenteista, kuten muodollisista subjekteista. Subjektiominaisuudet määrittyvät kielikohtaisesti asteittain. Kielten välillä voi siis prototyyppisyyden teorian nojalla olla eroja niissä kriteereissä, joiden pohjalta subjekteja määritellään. Lähtökohdaksi subjektien tutkimuksessa on kuitenkin otettava morfosyntaktiset ominaisuudet. Näitä ovat esimerkiksi sanajärjestys, kongruenssi ja osallistuminen erilaisiin syntaktisiin operaatioihin.

Suomen kielessä ei-kanonisina voidaan pitää eksistentiaalilauseiden partitiivisubjektia ja erilaisten nesessiivi- ja infinitiivirakenteiden genetiivisubjektia. Valtaosa eksistentiaalilauseista on intransitiivisia eivätkä ne kongruoi verbin kanssa. Lisäksi sanajärjestys on yleensä käänteinen. Sinhalan kielessä ei-kanonisiksi subjekteiksi voidaan laskea ainakin datiivisubjektit ja joissakin intransitiivisissa lauseissa ilmenevät akkusatiivisubjektit. Datiivisijaiset subjektit esiintyvät usein involitiivisten verbien yhteydessä, mutta tarkkaa semanttista kuvausta näiden verbien luokasta on mahdotonta antaa. Datiivisijaiset subjektit voidaan jättää pois koreferentiaalisessa sivualuseessa, mutta päälauseen subjektin ollessa datiivissa ei sivulauseessa voi olla ellipsiä.

Transitiivisuuden on havaittu liikkuvan jatkumolla, jossa tarkkaa rajaa transitiivisten ja intransitiivisten lauseiden välille on vaikea vetää. Sinhalan kielessä ero kanonisten ja ei-kanonisten subjektien välillä vastaa transitiivisuuden vaihtelua agentiivisuuden ja volitiivisuuden suhteen. Suomen kielessä eksistentiaalilauseiden ei ole havaittu olevan vähemmän transitiivisia, mutta eksistentiaalilauseen ja vastaavan nominatiivisijaisen intransitiivilauseen välillä on se ero, että partitiivisijaista subjektia voidaan pitää epämääräisenä. Transitiivisuuden käsitettä laajentamalla myös suomen eksistentiaalilauseiden ei-kanonisen merkinnän syy voitaisiin nähdä transitiivisuuden vaihtelussa.

Avainsanat - Nyckelord
ei-kanoninen merkitseminen, subjekti, prototyyppisyys
Säilytyspaikka - Förvaringställe
yleisen kielitieteen laitos / humanistisen tiedekunnan kirjasto
Muita tietoja