Tiedekunta/Osasto - Fakultet/Sektion
hist.-kielitieteell.
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Voutilainen, Atro Tapio
Työn nimi - Arbetets titel
Kirjoitetun kielen syntaktisesta ymmärrettävyydestä
Oppiaine - Läroämne
Yleinen kielitiede
Työn laji - Arbetets art
pro gradu -tutkielma
Aika - Datum
maaliskuu 1988
Sivumäärä - Sidoantal
161
Tiivistelmä - Referat

Tässä tutkielmassa tarkastellaan kirjoitetun kielen ymmärrettävyyttä rakenteelliselta kannalta. Lähtökohtana on kahden tieteenalan - lingvistiikan, erityisesti syntaksin, ja toisaalta kognitiivisen psykologian - piirissä tehtyjen havaintojen saattaminen ymmärrettävyyteen vaikuttavien rakenteiden kartoituksen kannalta yhteismitallisiksi.

Tutkielman alkupuolella perehdytään kielen prosessoinnin, erityisesti lukemisen, psykologiaan. Kielen ymmärtämisprosessi osoittautuu välittömästi tapahtuvaksi. Prosessointia tapahtuu paljolti samanaikaisesti usealla eri tasolla (alkaen fyysisen ärsykkeen havaintoprosesseista morfologisten ja syntaktisten tasojen kautta aina pragmaattisen tason ymmärtämisprosesseihin). Tasojen välinen interaktio ei ole vapaata: kognitiivisella systeemillä on kontrolliarkkitehtuurinsa, joka säätelee tasojen välistä kaksisuuntaista interaktiota.

Prosessointi tapahtuu siis välittömästi. Ehdontonta välittömyysoletukseen pitäytymisen mahdollisuutta raskaslukuisten lauserakenteiden kartoittamisen kannalta tarkastellaan. Sana tai morfeemi kerrallaan tapahtuva syntaktisen kompleksisuuden mittaaminen osoittautuu niin ongelmalliseksi, että suurempaan kielelliseen yksikköön pitäytyminen osoittautuu perustelluksi. Lause kognitiivisesti relevanttina rakenteellisena yksikkönä osoittautuu uskottavaksi. Lause kytketään kognitiivisen psykologian piirissä käytettyyn proposition käsitteeseen. Työmuisti mielletään säilytyskapasiteetiltaan rajallisena "työtilana", jonka säilytyskyky on sitä huonompi, mitä pienemmässä määrin semanttisesti valmista, propositiotason edustumaksi muodostunutta prosessoitu aines on.

Lauseen rakenteellisen ymmärrettävyyden kriteeriksi ja muuttujaksi tulee tässä tutkielmassa se, kuinka eheä lause on. Tällä tarkoitetaan lähinnä lauseen pääverbin ja sen argumenttien keskinäistä etäisyyttä. Lausetta voidaan pitää sitä raskaslukuisempana, mitä enemmän (ydin)lauseen sisälle sijoittuu muuta materiaalia.

Äärimmäisenä esimerkkinä hankalaymmärteisyydestä voidaan pitää lausetta, johon upotettuun lauseeseen on upotettu mahdollisesti upotuksen tai upotuksia sisältävä lause. Esimerkiksi:

Liisa jota Jussi jota Maija rakasti yllytti innostui.

Esimerkin tyyppisten suppilolauseiden hankalaymmärteisyydestä voidaan pitää niiden joltistakin esiintymättömyyttä laajoissakaan tektiaineistoissa.

Suppilolauseiden yhteydessä tarkastellaan myös rekursion käsitteen psykologista relevanssia.

Avainsanat - Nyckelord
luettavuus, ymmärrettävyys, jäsentäminen
Säilytyspaikka - Förvaringställe
Hist.-kielitieteellisen osaston kirjasto
Muita tietoja

Tiedekunta/Osasto - Fakultet/Sektion
Historiallis-kielitieteellinen osasto
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Alkula, Riitta
Työn nimi - Arbetets titel
Natural language processing and information retrieval: intermediary system applications
Oppiaine - Läroämne
Yleinen kielitiede
Työn laji - Arbetets art
Pro gradu -tutkielma
Aika - Datum
marraskuu 1988
Sivumäärä - Sidoantal
63 s.
Tiivistelmä - Referat

Tutkielmassa selvitetään eri mahdollisuuksia, miten automaattista luonnollisen kielen käsittelyä voidaan soveltaa tiedonhakuun, ja mitä ongelmia tässä soveltamisessa on. Tavoitteena on selvittää, miten kirjoitettua suomen kieltä analysoivia ohjelmia voidaan hyödyntää suomalaisessa TÄLLI-projektissa (Tiedonhaun älykkäät käyttöliittymät), jossa kehitetään tiedonhaun välittäjäjärjestelmän prototyyppi KISIR (Knowledge-based intermediary system for information retrieval).

Tiedonhaku tarkoittaa tässä tutkielmassa viitetietojen tai kokonaisten dokumenttien hakua suorakäyttöisestä tiedonhakujärjestelmästä eli tekstityyppisen tiedon hakua.Välittäjäjärjestelmät ovat tietokoneohjelmia, jotka sijoitetaan käyttäjän ja varsinaisen tiedonhakujärjestelmän väliin. Niiden tehtävänä on yksinkertaistaa ja tehostaa ihmisen ja tietokoneen välistä vuorovaikutusta esimerkiksi siten, että välittäjäjärjestelmää voidaan ohjata yksinkertaisemmin komennoin kuin varsinaista tiedonhakujärjestelmää.

Tutkielman alussa esitellään tekstitiedonhaun erikoisongelmia, jotka juontuvat hakujärjestelmään tallennettavien tekstien käsittelytavasta (käänteishakemistoon tallennetaan tekstissä esiintyneet sanat taivutusmuotoisina) sekä niitä keinoja, joilla tiedonhakujärjestelmät pyrkivät ratkaisemaan tällaisesta tallennustavasta seuraavat erilaiset ongelmat. Sen jälkeen luodaan katsaus luonnollisen kielen automaattisen käsittelyn sovelluksiin yleisesti ja kuvataan tarkemmin muutamia projekteja, joissa luonnollisen kielen analyysia on sovellettu tiedonhakujärjestelmiin.

Suomen kielen automaattista käsittelyä tutkii kaksi projektiryhmää, toinen Helsingin yliopistossa ja toinen SITRA:ssa. Nämä projektit ja niissä kehitetyt analyysiohjelmat esitellään lyhyesti. Tämän jälkeen kerrotaan KISIR-välittäjäjärjestelmän kehittämistyöstä ja niistä erikoisongelmista, jotka seuraavat projektin tavoitteenasettelusta. KISIR-välittäjäjärjestelmän on tarkoitus olla yleinen välittäjäjärjestelmä (ei vain tietylle käyttäjäryhmälle tai tietyn aihealueen tietokannoille tarkoitettu), joka tukee suomen kielellä toteutettavaa tiedonhakua. Tutkielmassa arvioidaan, miten suomen kieltä käsitteleviä ohjelmia voidaan käytännössä hyödyntää KISIR-prototyypissä. Lopuksi pohditaan yleisemmin, miksi tietokonelingvistiikan tuloksia ja luonnollista kieltä käsitteleviä ohjelmia on varsin vähän sovellettu tiedonhakuun, ja miten tilannetta voisi muuttaa.

Avainsanat - Nyckelord
tiedonhaku, välittäjäjärjestelmät, luonnollisen kielen automaattinen analyysi
Säilytyspaikka - Förvaringställe
Historiallis-kielitieteellisen osaston kirjasto
Muita tietoja

Tiedekunta/Osasto - Fakultet/Sektion
Hist.kielit.os.
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Norberg, Markku Sakari
Työn nimi - Arbetets titel
Koskenniemen kaksitasomallin mukainen, foneemipohjainen kuvaus ranskan adjektiivien ja substantiivien taivutusmorfologiasta
Oppiaine - Läroämne
Yleinen kielitiede
Työn laji - Arbetets art
pro gradu -työ
Aika - Datum
syysk. 1988
Sivumäärä - Sidoantal
93+9
Tiivistelmä - Referat

Kaksitasomalli on Kimmo Koskenniemen kehittämä tietokonelingvistinen malli, joka ilmaantui kielitieteen näyttämölle ensimmäisen kerran vuonna 1983. Kuluneiden vuosien aikana kaksitasomallia on sovellettu useiden erityyppisten kielten morfologian kuvaukseen. Sovellan tässä työssäni kaksitasomallia ranskan morfologian kuvaukseen. Työni eroaa tähänastisista kaksitasomallin sovellutuksista siinä, että kuvauskohteenani on fonemaattisesti esitetty kieli. Tietääkseni työ on ensimmäinen laatuaan.

Työni aluksi esittelen kaksitasomallin. Keskityn esittelemään kaksitasoformalismia. Kaksitasoformalismi on yleinen formalismi, jota pitäisi voida käyttää minkä tahansa kielen morfologian kuvauksessa. Tässä yhteydessä esittelen myös sen, miten kielitieteellistä tietoa esitetään kaksitasomallissa. Totean, että kaksitasomallissa segmentaalinen tieto ja muu morfologinen tieto esitetään leksikaalisella tasolla segmenttijonoissa. Argumentoin sen puolesta, että kuvauksessa nämä kaksi tulisi erottaa toisistaan.

Ranskan kuvaukseni rakennan siltä pohjalta, että sisällytän vain segmentaalista tietoa kuvaukseeni eli leksikaaliselle tasolle. Koska kaksitasomallin säännöt eivät tällä hetkellä voi ottaa huomioon muuta kuin segmenttijonoihin koodattua tietoa, kuvaukseni jää puolitiehen. Jokainen kirjoitettu sääntö jättää kuvauksen ulkopuolelle ne sanat, joihin sääntö ei sovellu. Koska en halua koodata merkkijonoihin muuta kuin segmentaalista tietoa, minun ei nykyisen kaksitasomallin puitteissa ole mahdollista kuvata säännöistä poikkeavia sanoja.

Lopuksi esitän, että kaksitasomallia olisi kehitettävä siihen suuntaan, että kuvauksessa olisi mahdollista erottaa segmentaalinen tieto ja muu syntaktis-morfologinen tieto.

Avainsanat - Nyckelord
tietokonelingvistiikka - morfologia - ranska - kaksitasomalli
Säilytyspaikka - Förvaringställe
Helsingin yliopiston hist.kielitiet. osaston kirjasto
Muita tietoja

Tiedekunta/Osasto - Fakultet/Sektion
Historiallis-kielitieteellinen
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Katri Olkinuora
Työn nimi - Arbetets titel
Toisen kielen opiskelijoiden leksikaalisesta kompetenssista
Oppiaine - Läroämne
Yleinen kielitiede
Työn laji - Arbetets art
pro gradu -tutkielma
Aika - Datum
lokakuu 1988
Sivumäärä - Sidoantal
91 ja 12 liitettä
Tiivistelmä - Referat

Tutkielmani on tehty yhteydessä Tukholman yliopiston kaksikielisyystutkimukseen Kaksikielisyys koulussa. Tässä tutkimuksessa on tarkoituksena selvittää Ruotsissa asuvien suomalaisten koululaisten kielitaitoa sekä ruotsin että suomen kielessä. Oma osuuteni tutkimuksessa on ollut ennen kaikkea kerätä ja analysoida suomalaisen vertailuryhmän materiaali. Tätä vertailuryhmän materiaalia vasten on sitten tarkasteltu Ruotsissa asuvien suomalaislasten suomen kielen taitoa.

Tutkielmani sisältää myös Kaksikielisyys koulussa -tutkimuksen lähtökohtana toimineen kanadalaisen tutkimuksen esittelyä sekä useiden muiden, erityisesti kaksikielisten opiskelijoiden leksikkoa käsittelevien, tutkimusten esittelyä.

Avainsanat - Nyckelord
Säilytyspaikka - Förvaringställe
Muita tietoja

Tiedekunta/Osasto - Fakultet/Sektion
historiallis-kielitieteellinen
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Jaana Ahti-Virtanen
Työn nimi - Arbetets titel
Puhelipsahduksista ja niiden implikoimista puheentuoton vaiheista
Oppiaine - Läroämne
Yleinen kielitiede/psykolingvistiikka
Työn laji - Arbetets art
pro gradu -tutkielma
Aika - Datum
joulukuu 1990
Sivumäärä - Sidoantal
105+17
Tiivistelmä - Referat

Muun kuin suomenkielisissä lipsahdustutkimuksissa on tarkasteltu havaituissa ja kirjatuissa puhelipsahduksissa liikkuvia (so.siirtymälipsahdukset) tai korvautuvia (so.substituutiolipsahdukset) puheentuoton yksiköitä.

Lipsahduksiin osallisiksi yksiköiksi on eri tutkimuksissa merkitty foneemipiirteitä (näistä tosin vain soinnillisuus), foneemeja, tavuja, sidonnaisia ja vapaita morfeemeja sekä sanaa pitempiäkin konstituentteja. Tästä on mm. päätelty, että em. yksiköt ovat puhujille psykologisesti tosia puheentuoton yksiköitä.

Lisäksi on tarkkailtu havaittujen lipsahdusten jakautumista selviksi tyyppiryhmiksi. Tyyppi on määräytynyt mm. siirtymälipsahduksessa siirtyvien yksiköiden liikkumissuunnan mukaan (tuloksena antisipaatioita, perseveraatioita tai transpositioita). Siirtymälipsahduksista täysin poikkeavan tyypin muodostavat valintavirheet eli substituutiot, joissa aiotun ilmaisun sana (joskus myös sidonnainen morfeemi) korvautuu aiottuun ilmaisuun kuulumattomalla vastaavankokoisella yksiköllä. Siirtymälipsahdukset tapahtunevat puheentuoton loppuvaiheessa: puskurimuistissa täytyy olla melko valmista lausemateriaalia, jotta esimerkiksi antisipaatiot (yksikön siirtyminen aiotulta paikaltaan aiemmaksi) syntyisivät. Valintavirheet lienevät melko varhaisia lipsahduksia: erhe tapahtuu, kun ilmaisuun tarvittavia yksiköitä haetaan mentaalisesta leksikosta.

Kerätty suomenkielinen lipsahdusaineisto näyttää toimivan odotetunlaisesti. Eri puheentuottoyksiköiksi mainitut ovat osallisia myös suomenkielisissä puhelipsahduksissa. Käytetty aineisto jakautuu myös muista lipsahdustutkimuksista tuttuihin tyyppiryhmiin.

Suomenkielisestä lipsahdusaineistosta voi kuitenkin havaita, että jaottelu useisiin lipsahdustyyppeihin on toissijaista. Lipsahdukset jakautuvat selvästi kahteen em. pääryhmään, siirtymiin ja valintavirheisiin. Tärkeää ei myöskään ole havainto (josta lipsahdustutkimuksia on ankarasti kritisoitu), että lähestulkoon kaikki mahdolliset puheentuottoyksiköiksi mainitut osallistuvat lipsahduksiin, vaan havainto, että näiden yksiköiden ominaisuudet (merkitys, ilmiasu) ja niiden sijainti ilmaisussa (tavu- ym. rajojen läheisyys) lisäävät lipsahdusten synnyn otollisuutta.

Avainsanat - Nyckelord
puhelipsahdukset, leksikko, puheentuotto
Säilytyspaikka - Förvaringställe
yleisen kielitieteen laitos
Muita tietoja