Tiedekunta/Osasto - Fakultet/Sektion
Humanistinen tiedekunta
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Antti Puurula
Työn nimi - Arbetets titel
TKK-2007 System for Open Vocabulary Speech Recognition of Estonian
Oppiaine - Läroämne
kieliteknologia
Työn laji - Arbetets art
Pro gradu
Aika - Datum
17.10.2007
Sivumäärä - Sidoantal
60
Ohjaaja(t)
Mikko Kurimo
Tarkastajat
Mikko Kurimo, Krister Lindén
Tiivistelmä - Referat

Tutkielmassa esitellään Teknillisen korkeakoulun Informaatiotekniikan Laboratoriossa vuosina 2005-2007 kehitetty vironkielen avoimen sanaston puheentunnistusjärjestelmä. Järjestelmä rakennettiin käyttäen modernin automaattisen puheentunnistuksen menetelmiä sekä soveltaen morfipohjaisen puheentunnistuksen menetelmiä, jotka kehitettiin viimeisen vuosikymmennen aikana Teknillisessä Korkeakoulussa suomen puheentunnistusta varten. Lisäksi esitellään uusi menetelmä morfipohjaisen puheentunnistuksen parantamiseksi käyttäen morfien välisiä riippuvuuksia. Järjestelmä opetettiin puhujariippumattomaan ja kohinaiseen avoimen sanaston jatkuvan puheen puheentunnistukseen lankapuhelin- ja kännykkäaineistolle käyttäen BABEL ja Estonian SpeechDat puhekorpuksia sekä Segakorpus tekstikorpusta. Morfipohjaisten kielimallien käytöllä saatiin saman luokan suhteellisia sanavirheen parannuksia kuin aikaisemmissa suomen kielen puheentunnistuksen kokeissa. Morfiriippuvuuksien käytöllä kielimallinnuksessa saatiin aikaiseksi huomattavasti pienempien sanavirheiden kielimallit, samalla tehden morfipohjaisen tunnistuksen sovellettavaksi useimmissa maailman kielistä ja useimmissa tämänhetkisissä puheentunnistusjärjestelmissä ilman merkittäviä muutoksia. Viimeiset morfiriippuvuuksien käyttöön perustuvat kielimallit antoivat 35,1% sanavirheen Estonian SpeechDat -aineistolla ilman puhuja-adaptaatiomenetelmiä, mikä on paras tämänhetkinen suoritus puheentunnistusjärjestelmältä vironkielisessä laajan sanaston puheentunnistuksessa.

Avainsanat - Nyckelord
avoimen sanaston puheentunnistus, laajan sanaston jatkuvan puheen tunnistus, akustinen mallintaminen, dekoodaus, kielimallinnus, varigram mallit, viro, morfiriippuvuus, morfi, koneoppiminen, Markovin piilomallit, Gaussin mikstuura
Säilytyspaikka - Förvaringställe
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos
Muita tietoja

Tiedekunta/Osasto - Fakultet/Sektion
Humanistinen tiedekunta
Laitos - Institution
Yleisen kielitieteen laitos
Tekijä - Författare
Henna-Riikka Laitinen
Työn nimi - Arbetets titel
Dialogijärjestelmät tietokoneroolipeleissä
Oppiaine - Läroämne
kieliteknologia
Työn laji - Arbetets art
Pro gradu -tutkielma
Aika - Datum
10.5.2007
Sivumäärä - Sidoantal
Ohjaaja(t)
Kimmo Koskenniemi
Tarkastajat
Tiivistelmä - Referat

Tutkielmassa pohditaan mitä vaatimuksia roolipeliympäristö asettaa dialoginhallinnalle, ja katsotaan esimerkkien kautta kuinka tämän voisi hoitaa. Tärkeää on pelaajan eläytyminen, immersio, peliin, ja hahmojen vaikuttaminen uskottavilta.Pelaajan täytyy kyetä hoitamaan asioita hahmojen kanssa, kuten tiedon hankkimista ja kaupankäyntiä. Jotta hahmot vaikuttaisivat eläviltä, on tärkeää mallintaa niille persoonallisuus ja tunteita, jotka vaikuttavat myös luonnollisen kielen käsittelyyn.

Avainsanat - Nyckelord
Säilytyspaikka - Förvaringställe
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos
Muita tietoja

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Humanistinen tiedekunta
Laitos - Institution - Department
Yleisen kielitieteen laitos
Tekijä - Författare - Author
Laura Salonen
Työn nimi - Arbetets titel - Title
Substantiivilausekkeen syntaktinen syvyys ruotsin kielessä
Oppiaine - Läroämne - Subject
yleinen kielitiede
Työn laji - Arbetets art - Level
Pro gradu -tutkielma
Aika - Datum - Month and year
3.10.2007
Sivumäärä - Sidoantal - Number of pages
64 + 3 liitettä
Ohjaaja(t)
Tarkastajat
Fred Karlsson, Seppo Kittilä
Tiivistelmä - Referat - Abstract

Tutkielma on luonteeltaan empiirinen ja sen aiheena on substantiivilausekkeen (NP) syntaktisen syvyyden tarkastelu ruotsinkielisen aineiston perusteella. Lakiteksteistä ja sanomalehtien pääkirjoituksista koostuvasta aineistosta on analysoitu NP:iden rakenne, pituus ja syntaktinen syvyystaso. Pääasiallisena kysymyksenasetteluna on selvittää, kuinka syvillä tasoilla ruotsin kielen NP:t voivat sijaita, sekä mitkä tekijät aiheuttavat syntaktista syvyyttä.

NP:n syntaktisen rakenteen kuvauksessa kiinnitetään erityistä huomiota ruotsin kielen NP:n erityispiirteisiin. Aineiston analysointi perustuu pitkälti dependenssikielioppiin, mutta lisäksi esitellään myös X-bar-teorian mukainen näkemys NP:n rakenteesta.

Kun NP:t esiintyvät yhä syvemmillä tasoilla, niiden määrä vähenee. NP:iden määritteiden määrät vähenevät pääsääntöisesti ja erityisesti jälkimääritteiden määrät vähenevät. Lisäksi todetaan lakitekstien NP:iden olevan kompleksisempia kuin sanomalehtikirjoitusten.

NP:n syvyystasoja todetaan aineistossa olevan 5 (N0-N4), tosin viimeinen taso on tilastollisesti marginaalinen.

NP:n syvyyttä aiheuttavat ruotsin kielessä etenkin seuraavat rakenteet: prepositiolausekkeet, genetiivit ja etumääritteenä olevat partisiippirakenteet.

Aineiston kahden tekstilajin tyylillisiä piirteitä käydään lävitse ja tekstejä verrataan toisiinsa syvyyden näkökulmasta.

Avainsanat - Nyckelord - Keywords
substantiivilauseke, NP, syntaksi, syvyys
Säilytyspaikka - Förvaringställe - Where deposited
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos
Muita tietoja - Övriga uppgifter - Additional information

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Humanistinen tiedekunta
Laitos - Institution - Department
Yleisen kielitieteen laitos
Tekijä - Författare - Author
Satu Honka
Työn nimi - Arbetets titel - Title
Kiellon voimistaminen ja kieltohakuinen kvanttoripronomini mikään
Oppiaine - Läroämne - Subject
yleinen kielitiede
Työn laji - Arbetets art - Level
pro gradu -tutkielma
Aika - Datum - Month and year
huhtikuu 2008
Sivumäärä - Sidoantal - Number of pages
74
Ohjaaja(t)
Tarkastajat
Fred Karlsson, Jaakko Leino
Tiivistelmä - Referat - Abstract

Tässä tutkielmassa käsitellään suomen kieltohakuisen kvanttoripronominin mikään suhdetta kiellon voimistamiseen. Kiellon voimistamisella tarkoitetaan sanoja ja moniosaisempia kokonaisuuksia, joiden käyttö lauseessa tekee sen kielteisyydestä voimakkaamman ja samalla selvemmin huomattavan tai painokkaamman. Tutkielmassa käsitellään kieltohakuisen kvanttoripronominin erilaisia esiintymiä, joissa sen voi sanoa toimivan kieltoa voimistavan ilmaisuna. Sitä verrattiin myös muihin vastaaviin ilmaisuihin, erityisesti sen viittausalan poissulkevan merkityksen suhteen.

Kieltohakuisen kvanttoripronominin partitiivimuodon mitään on todettu kieliopillistuneen ja toimivan puhekielessä kiellon voimistajana. Tässä tutkielmassa on kuitenkin keskitytty kirjoitettuun kieleen ja siinä erityisesti sellaisiin tapauksiin, joissa kieltohakuinen kvanttoripronomini toimii attribuuttina jollekin (substantiivi)pääsanalle. Tällaisista esiintymistä löydettiin tiettyjä vakiintuneita konstruktioita, joissa nämä kvanttoripronominin ja pääsanan yhteisesiintymät esiintyivät. Niissä kvanttoripronominin katsotaan toimivan oletuksenmukaisesti, mutta samalla se kuitenkin tekee näistä konstruktioista ehdottomammin kielteisiä. Toisaalta löytyi myös kvanttoripronominin ja sen pääsanan yhteisesiintymiä, jotka sellaisenaan olivat käytöltään kieltoa voimistavia. Selkeimpänä esimerkkinä tällaisesta oli missään tapauksessa. Sen käyttö ei ollut enää kompositionaalista, vaan sen tehtävä kokonaisuutena oli juuri kiellon voimistaminen.

Kieltoa voimistavat ilmaisut voidaan jakaa pääasiallisesti minimaalisiin ja totaalisiin. Näistä ensimmäiset ilmaisut perustuvat siihen, että ne esittävät jonkin pienimmän mahdollisen määrän, jolloin sen alle menevä osa ei ole mitään, eli niiden toiminta perustuu kaikkein pienimmänkin osan kieltämiseen. Toisaalta taas totaaliset kiellon voimistajat perustavat tehonsa siihen, että ne kieltävät kaiken (koko viittausalalta), jolloin ne ovat ehdottomasti kielteisiä. Yksittäin esiintyvän kieltohakuisen kvanttoripronominin katsottiin kuuluvan tähän jälkimmäiseen ryhmään. Jaottelut perustuivat siis kieltoa voimistavien ilmaisujen merkitykseen.

Avainsanat - Nyckelord - Keywords
kieltohakuinen kvanttoripronomini, konstruktiot, kieliopillistuminen, kiellon voimistaminen
Säilytyspaikka - Förvaringställe - Where deposited
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos
Muita tietoja - Övriga uppgifter - Additional information

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Humanistinen tiedekunta
Laitos - Institution - Department
Yleisen kielitieteen laitos
Tekijä - Författare - Author
Tytti Voutilainen
Työn nimi - Arbetets titel - Title
Manresalaisten kielellinen identiteetti haastattelututkimuksen valossa
Oppiaine - Läroämne - Subject
Yleinen kielitiede
Työn laji - Arbetets art - Level
Pro gradu
Aika - Datum - Month and year
toukokuu 2008
Sivumäärä - Sidoantal - Number of pages
62
Ohjaaja(t)
Fred Karlsson
Tarkastajat
Fred Karlsson, Seppo Kittilä
Tiivistelmä - Referat- Abstract

Pro gradu -tutkielmassani tarkastelen kieli-identiteettiä ja -asenteita Manresan kaupungissa, joka sijaitsee Kataloniassa, Espanjassa. Tutkielman keskeiset kysymykset koskettavat alueella puhuttujen kahden kielen, katalaanin ja espanjan, käyttöä ja niihin liittyviä arvoja ja asenteita: mitä kieli merkitsee käyttäjälleen ja mikä osuus kielellä on käyttäjien identieteetissä. Tutkielmani tavoitteena on kuvata katalonialaisten kielellistä identifioitumista ja tutkia tarkemmin kielen merkitystä identiteetin rakentajana sekä kielen ja identiteetin välistä suhdetta.

Tutkielman aineisto perustuu vuoden 1999 tammikuussa tehtyihin haastatteluihin. Haastatteluiden avulla selvitin yksilötasolla kielitaitoon, kielenkäyttöön, kieli- ja kansallisuusasenteisiin sekä kielelliseen identifioitumiseen liittyvää problematiikkaa. Halusin saada selville haastateltavien kielenkäyttöalueita ja mitä merkitystä kielellä on haastateltaville. Tutkielman kohderyhmä koostui 31:stä Manresassa pysyvästi asuvasta henkilöstä.

Otoksen henkilöiden elämässä katalaanin kielellä on aktiivinen rooli. Katalaanin kielellä oli paitsi symbolinen myös käytännöllinen merkitys: se oli olennainen osa arkipäivän kommunikointia. Katalaanin kielellä on otokselle selkeää symboliarvoa ja kielellä on merkittävä vaikutus ihmisten toiminnalle yhteiskunnassa. Katalonialaisuudessa on kysymys ensisijaisesti katalaaniksi itsensä tuntemisesta, ei niinkään suoraan kielitaidosta. Kielen osuutta kulttuuriin sosiaalistumisessa ja Kataloniaan ja katalonialaisiin kuulumisena piti suuri osa kuitenkin hyvin tärkeänä. Kielen avulla tuettiin ja vahvistettiin katalonialaisiin kuulumista. Suurin osa otokseen haastatelluista koki ensisijaista yhteenkuuluvuutta Kataloniaan ja katalonialaisiin. Otosta kuvaa voimakas kielitietoisuus ja katalaanikielisyys. Katalaanin kieleen liittyvät tunteet olivat systemaattisesti positiivisia ja myös omaa aluetta arvostettiin kovasti. Molempiin kielíin liitettiin hyötynäkökulma, mikä viittaisi siihen, että kaksikielisessä yhteisössä pärjääminen koetaan tärkeäksi.

Kulttuurien ja kielten monimuotoisuus on espanjalaisen yhteiskunnan nykyisyyttä ja todellisuutta. Tulevaisuuden näkymiin vaikuttaakin siis yhteisön kielenkäyttö, joka Kataloniassa on katalaanin osalta voimakasta. Tutkielman valossa Manresassa koetaan, että kielestä on hyötyä nyt ja tulevaisuudessa.

Avainsanat - Nyckelord - Keywords
Säilytyspaikka - Förvaringställe - Where deposited
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos
Muita tietoja - Övriga uppgifter - Additional information

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Faculty of Arts
Laitos - Institution - Department
Department of General Linguistics
Tekijä - Författare - Author
Dorota Decewicz-Blaut
Työn nimi - Arbetets titel - Titel
Acquisition of Polish pronunciation by Finnish and Russian learners
Oppiaine - Läroämne - Subject
general linguistics
Työn laji - Arbetets art - Level
Pro gradu
Aika - Datum - Month and year
May 2008
Sivumäärä - Sidoantal - Number of pages
100 + enclosures
Ohjaaja(t)
Tarkastajat
Fred Karlsson, Seppo Kittilä
Tiivistelmä - Referat - Abstract

The objective of the research was to confirm whether a similarity of the second language to the first language facilitates or inhibits the acquisition of pronunciation of the latter one.

The second language was Polish. The acquisition of its pronunciation was examined in two groups: three Finns and three Russians. All of them were fluent in Polish and had lived in Poland for at least one year. The research material was collected during 20-30 minute interviews. The research consisted of two elements: text reading and discussion on same subjects. All interviews were digitally recorded and then listened to a numerous number of times. The incorrect pronunciations were transcribed and analyzed. Only the incorrect pronunciations were used for the analysis.

My research revealed that errors among Russians were over two times more frequent than among Finns. The qualitative analysis of the collected corpora of both groups showed that each language had specific error types. The most frequent errors made by Russians included some features typical of Russian like akanie and palatalization of consonants that were present in Polish pronunciation in negative transfers. In Finns' corpora the most frequent errors were in nasalized vowels and fricatives.

The research confirmed that the language similarity or close relation as it is between the Polish and the Russian languages is not facilitating. The identical phonemes do not cause problems but similarity leads to confusion. The first language influence is visible in the types of errors through negative transfers.

Avainsanat - Nyckelord - Keywords
second language acquisition, contrastive phonology, contrastive phonetics, error analysis, Polish pronunciation acquisition
Säilytyspaikka - Förvaringställe - Where deposited
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos
Muita tietoja - Övriga uppgifter - Additional information

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Humanistinen tiedekunta
Laitos - Institution - Department
Yleisen kielitieteen laitos
Tekijä - Författare - Author
Anu Ylisalmi
Työn nimi - Arbetets titel - Titel
Terminologisesta sanastotyöstä ontologiseen sanastotyöhön - terminologisen sanastotyön hyödyntämismahdollisuudet ontologiatyössä
Oppiaine - Läroämne - Subject
kieliteknologia
Työn laji - Arbetets art - Level
Pro gradu
Aika - Datum - Month and year
huhtikuu 2008
Sivumäärä - Sidoantal - Number of pages
52
Ohjaaja(t)
Tarkastajat
Tiivistelmä - Referat - Abstract

Monet eri alojen organisaatiot ovat kiinnostuneita hyödyntämään toiminnassaan semanttista webiä ja ontologioita. Ontologioita kehitetään tällä hetkellä kuitenkin lähinnä yksittäisissä tutkimusprojekteissa, eikä ontologioiden sisällön kehittämiseen erikoistuneita tahoja vielä juuri ole olemassa. Ontologiatyön periaatteet eivät myöskään ole vakiintuneet, vaan käytettävistä menetelmistä päätetään erikseen kunkin ontologian laadinnan yhteydessä.

Ontologiatyöllä ja terminologisella sanastotyöllä on merkittäviä yhtäläisyyksiä. Tämän tutkimuksen tarkoituksena oli selvittää, mitä hyötyä terminologisen sanastotyön vakiintuneista periaatteista ja käytännöistä voisi olla ontologiatyölle. Lisäksi selvitettiin kieliteknologian ja tietotekniikan hyödyntämismahdollisuuksia.

Tutkielmassa perehdyttiin ensin terminologisen sanastotyön ja ontologiatyön periaatteisiin ja näiden pohjalta koottiin yhteen sanastotyön ja ontologiatyön erot ja yhtäläisyydet. Erot ja yhtäläisyydet huomioon ottaen tutkimuksessa esitettiin malli siitä, miten ontologiatyötä voidaan tehdä ontologisen sanastotyön menetelmin. Malli perustuu terminologisessa sanastotyössä käytössä olevaan sanastoprojektin etemismalliin.

Tutkielmassa nostettiin esiin käsitesuhteiden esittäminen ja monikielisyyden hallitseminen ontologisen sanastotyön erityiskysymyksinä. Tutkielmassa suositellaan Yleisen suomalaisen ontologian käsitehierarkiaa hyödynnettäväksi suomenkielisessä ontologisessa sanastotyössä. Tutkielmassa esitellään kaksi erilaista, laajaa käsitesuhdejoukkoa. Monikielisessä ontologiassa erikielisten termien väliset erot täytyy voida ilmaista tarkasti, jotta ontologiaa käytettäessä ei tule päättelyvirheitä.

Sekä terminologinen sanastotyö että ontologiatyö ovat aikaa vievää asiantuntijatyötä, joten tutkimuksessa selvitettiin myös olemassa olevia työvälineitä. Lisäksi selvitettiin edellä mainitun mallin pohjalta, miten kieliteknologiset ja tietotekniset työvälineet voisivat helpottaa asiantuntijan työtä nykyistä enemmän. Näin saatiin kattava kuva siitä, millainen olisi ihanteellinen ontologisen sanastotyön työväline.

Avainsanat - Nyckelord - Keywords
sanastotyö, terminologia, ontologiatyö, ontologiat
Säilytyspaikka - Förvaringställe - Where deposited
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos
Muita tietoja - Övriga uppgifter - Additional information

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Humanistinen tiedekunta
Laitos - Institution - Department
Yleisen kielitieteen laitos
Tekijä - Författare - Author
Tommi Pirinen
Työn nimi - Arbetets titel - Titel
Suomen kielen äärellistilainen morfologinen jäsennin avoimen lähdekoodin resurssein
Oppiaine - Läroämne - Subject
Kieli-, puhe- ja käännösteknologian maisteriohjelma
Työn laji - Arbetets art - Level
Pro gradu
Aika - Datum - Month and year
huhtikuu 2008
Sivumäärä - Sidoantal - Number of pages
64
Ohjaaja(t)
Kimmo Koskenniemi, Krister Lindén
Tarkastajat
Tiivistelmä - Referat - Abstract

Tutkielma on kuvaus suomen kielen automaattisen äärellistilaisen morfologisen jäsentimen toteutuksesta avoimen lähdekoodin menetelmin ja resurssein. Tutkielmassa kuvataan Kotimaisten kielten tutkimuskeskuksen julkaiseman Nykysuomen sanalistan sisältöä morfologisen jäsentimen toetuttamisessa. Äärellistilaisista menetelmistä tutkielma tarkastelee SFST-nimisen ohjelman käyttämistä jäsennintransduktorin rakentamisessa. Lisäksi tutkielmassa esitetään toteutetun järjestelmän testausmentelmä valmiin morfologisesti jäsennetyn korpuksen avulla.

Avainsanat - Nyckelord - Keywords
äärellistilaiset menetelmät, morfologia, suomen kieli
Säilytyspaikka - Förvaringställe - Where deposited
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos
Muita tietoja - Övriga uppgifter - Additional information

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Humanistinen tiedekunta
Laitos - Institution - Department
Yleisen kielitieteen laitos
Tekijä - Författare - Author
Era Eriksson
Työn nimi - Arbetets titel - Title
Establishing Parameters for Byte n-gram Language Identification
Oppiaine - Läroämne - Subject
kieliteknologia
Työn laji - Arbetets art - Level
Pro gradu
Aika - Datum - Month and year
huhtikuu 2008
Sivumäärä - Sidoantal - Number of pages
Ohjaaja(t)
Tarkastajat
Tiivistelmä - Referat - Abstract

Using character n-gram signatures is a proven information-retrieval technique, which is now regaining interest and popularity in fields related to email filtering and classification.

However, the available literature is dominated by experiments against legacy or undocumented corpora, typically involving e.g.newswire-style and scholarly writing.

It is unclear to what extent these earlier results are generalizable and transferable to different textual domains. Thus, in this thesis, we will set up a series of experiments to attempt to validate or refute a set of hypotheses about how byte n-gram classification should be configured for different problem domains.

Experiments will mainly be carried out against van Noord's de facto reference implementation, TextCat (van Noord, 1997).

Avainsanat - Nyckelord - Keywords
Säilytyspaikka - Förvaringställe - Where deposited

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Humanistinen tiedekunta
Laitos - Institution - Department
Yleisen kielitieteen laitos
Tekijä - Författare - Author
Silvana Pérez Läherinta
Työn nimi - Arbetets titel - Title
Chatbot-ohjelmien hyötykäyttö vieraan kielen oppimisessa
Oppiaine - Läroämne - Subject
kieliteknologia
Työn laji - Arbetets art - Level
Pro gradu
Aika - Datum - Month and year
huhtikuu 2008
Sivumäärä - Sidoantal - Number of pages
60 + 3 (liite)
Ohjaaja(t)
Tarkastajat
Tiivistelmä - Referat - Abstract

Tutkielman tarkoituksena oli arvioida luonnollista kieltä simuloivien ns.chatbot-ohjelmien soveltuvuutta kielenopiskelun apuvälineeksi sekä tutkia, millaisilla edellytyksillä ohjelmia voitaisiin tähän suuntaan kehitää.Työssä selvitettiin vuoropuhelun rakenteen ja ihmisten välisiä keskusteluja tyypittäviä johdonmukaisuuksia, ja näiden luonnollisella kielellä käytyjen keskustelujen toteuttamista chatbot-ohjelmille. Ohjelmien mahdollisuuksien havainnollistamiseksi tutustuttiin dialoginhallintatekniikoihin, luonnollisen kielen generointia ja käsittelyä tukeviin dialogijärjestelmiin, vieraan kielen oppimisen metodologisiin tutkimuksiin, CALL (Computer Assisted Language Learning) -tutkimuksiin sekä tältä alueelta erityisesti perinteisiä chatbot-ohjelmia käsitteleviin tutkimustuloksiin. Tämän pohjalta arvioitiin ohjelmien soveltuvuutta CALL:n työvälineeksi. Suoranaista chatbot-aineistoa on kuitenkin vähän, ja suurin syy aineiston vähäisyyteen on, että esitetyn aiheen kannalta mielekkäitä tutkimusasetelmia ei voida toteuttaa ilman olemassa olevia työvälineitä ja tarvittavaa tekniikkaa.

Tutkielmassa käy ilmi, että chatbotin ovat nykyisellään toimivia lähinnä edistyneille kielenopiskelijoille, erityisesti sen vuoksi, että niitä on suunniteltu pääasiassa kieltä valmiiksi osaaville käyttäjille. Ongelmia aiheuttavat useat seikat, kuten kielen monimuotoisuus ja monimerkityksellisyys, sekä ohjelmallisesti mm. monissa chatboteissa käytetyt hahmontunnistus- ja luonnollisen kielen käsittelyn tekniikat. Jotta tietokone voisi toimia keskustelukumppanina, sen täytyisi olla niin inhimillinen kuin mahdollista. Tätä varten luonnollista kieltä simuloivan robotin olisi hallittava useita alueita. Sen olisi kyettävä luonnollisen kielen käsittelyyn ja sillä olisi oltava muisti, johon tallennetaan se, mitä kone tietää tai oppii. Lisäksi sen olisi pystyttävä automaattiseen päättelyyn ja käyttämään tallennettua informaatiota kysymyksiin vastaamista ja johtopäätösten tekoa varten. Robotin olisi oltava koneoppiva, sen olisi pystyttävä adaptoitumaan uusiin ympäristöihin ja havaitsemaan kuvioita.

Koska chatbottien mahdollisuudet ovat toistaiseksi yksipuolisia, voitaisiin niitä kehittää osa-alueittain - kielen tiettyyn alueeseen keskittyviä botteja on helpompi rakentaa käsiteltävän maailman ollessa rajallinen. Työssä pyrittiin kuvailemaan pedagogisia menetelmiä ja vuorokeskustelun rakenteen ominaisuuksia, joita chatbottien kehittäjät voisivat huomioida suunnitellessaan tietokoneavusteista kielenopetusta. Näitä ovat esimerkiksi päämäärän tai topiikin luominen keskustelulle tai osakeskusteluille, opiskelijan kieliopillisen tason tunnistaminen ja käyttäminen vuorovaikutteisesti, virheenkorjauksen hienovaraiset tekniikat, yhteisen aineiston luominen, roolipeliympäristöt ja botin persoonallisuudet. Konteksteja on valtavasti, ja tekoälyteknologian chatbottien kehittyessä saataneen parempi kuva niiden hyödyllisyydestä CALL:n apuvälineenä.

Avainsanat - Nyckelord - Keywords
Chatbot, CALL, Turingin testi, AI, AIML, hahmontunnistus, dialogijärjestelmät, keskustelun simulointi
Säilytyspaikka - Förvaringställe - Where deposited
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Humanistinen tiedekunta
Laitos - Institution - Department
Yleisen kielitieteen laitos
Tekijä - Författare - Author
Tiina Taivainen
Työn nimi - Arbetets titel - Title
Somalitaustaisten nuorten kaksikielisyyden, identiteetin ja kaksikielisen opetuksen vaikutus sopeutumiseen Suomeen
Oppiaine - Läroämne - Subject
yleinen kielitiede
Työn laji - Arbetets art - Level
Pro gradu
Aika - Datum - Month and year
helmikuu 2007
Sivumäärä - Sidoantal - Number of pages>
71 + 6
Ohjaaja(t)
Tarkastajat
Fred Karlsson, Ritva Laury
Tiivistelmä - Referat - Abstract

Tämä pro gradu -tutkielma käsittelee somalitaustaisten maahamuuttajanuorten kaksikielisyyttä, identiteettiä ja sopeutumista Suomeen. Lisäksi tutkielmassa tarkastellaan heidän saamaansa maahanmuuttajille suunnattua kaksikielistä peruskouluopetusta. Tutkimuksen tavoitteena oli selvittää, miten somalin kielen tai somalinkielinen opetus ala-asteella vaikuttaa somalimaahanmuuttajien myöhempään kielelliseen ja kulttuuriseen sopeutumiseen Suomeen. Tutkimuksessa pyrittiin myös selvittämään, mikä on kaksikielisyyden, identiteetin ja sopeutumisen suhde.

Tutkimuksen aineisto on koottu haastattelemalla somalitaustaisia nuoria, jotka ovat asuneet Suomessa keskimäärin yli kymmenen vuotta ja jotka ovat jo päättäneet peruskoulun. Rajaus tehtiin näin, jotta olisi mahdollista tarkastella informanttien nykyhetkistä sopeutumisen astetta suhteessa nuorempana saatuun opetukseen. Haastattelumenetelmänä käytettiin teemahaastattelua.

Aineiston perusteella ei tutkimuksessa pystytty luotettavasti osoittamaan, että ala-asteella saadulla somalin kielen opetuksella olisi vaikutusta informanttien sopeutumiseen, mutta asenteilla opetusta kohtaan ja koetulla opetuksen laadulla havaittiin olevan yhteys sopeutumiseen. Parhaiten sopeutuneet kokivat somalin kielen opetuksen tärkeäksi ja olivat sen laatuun pääsääntöisesti tyytyväisiä. He myös pitivät somalin kielen säilyttämistä tärkeänä. Huonoiten sopeutuneet puolestaan eivät pitäneet somalin kielen opetusta hyödyllisenä eivätkä kokeneet saamaansa opetusta mielekkääksi.

Kaksikielisyydellä ja identiteetillä havaittiin aineiston perusteella olevan yhteys maahanmuutajien sopeutumiseen. Aineiston parhaiten sopeutuneiden todettiin pystyneen säilyttämään sekä alkuperäisen kielellisen ja kulttuurisen identiteettinsä, mutta myös omaksumaan uuden kielen ja kulttuurin. Parhaiten sopeutuneet kokivat itsensä sekä somalialaisiksi että suomalaisiksi. he myös kertoivat käyttävänsä ja osaavansa molempia kieliä tasapuolisesti. Tällöin kahden kielen ja kulttuurin välillä ei siis ole ristiriitaa.

Avainsanat - Nyckelord - Keywords
kaksikielisyys, kaksikielinen opetus, maahanmuuttajien opetus, sopeutuminen, somalialaiset, kielellinen ja kulttuurinen identiteetti
Säilytyspaikka - Förvaringställe - Where deposited
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Faculty of Arts
Laitos - Institution - Department
Department of General Linguistics
Tekijä - Författare - Author
William Scott Emery-Sphar
Työn nimi - Arbetets titel - Title
Phonologically Conditioned Vowel-to-Vowel Coarticulation in VCV Sequences
Oppiaine - Läroämne - Subject
general linguistics
Työn laji - Arbetets art - Level
Pro gradu
Aika - Datum - Month and year
December 2006
Sivumäärä - Sidoantal - Number of pages
58 pages + 8 pages of appendices
Ohjaaja(t)
Tarkastajat
Fred Karlsson, Martti Vainio
Tiivistelmä - Referat - Abstract

The ultimate purpose of this investigation was to explore the relationship between phonetics and phonology through a discussion of phonemic vowel quality inventories and the phonetic principles that motivate and constrain them. The central focus was the question whether or not inventory size, as a system-level property of language's phonology, interacts with processes of phonetic variation, specifically in terms of vowel-to-vowel coarticulation. The empirical side of the investigation included a spectral analysis of vowels in Finnish (Uralic; Finland) and Kabyle (Afro-Asiatic; Berber; Algeria). Six male Finnish speakers and one Kabyle speaker were recorded. The original goal was to compare the distribution of vowel qualities and the amount of vowel-to-vowel coarticulation in the two languages, but the unavailability of more Kabyle speakers made such a comparison very difficult. However despite this difficulty, both anticipatory and carry-over coarticulation were investigated in Finnish by measuring context-dependent changes in the F1 and F2 values of Finnish vowels based on the phonetic quality of a flanking context-vowel. The differences were tested for significance using independent sets of one-way ANOVAs for F1 and F2 of each target vowel. Three significant effects were found (one in the F1 dimension, and two in the F2 dimension) such that: (1) the F1 values of [i] were significantly higher when preceded by an [a] than when preceded by another [i]; (2) the F2 values of [i] were consistently lower when preced by [a] or [u] than when preceded by another [i]; and (3) the F2 values of [a] were consistently higher when preceded by [i] than when preceded by another [a]. In spite of providing only very tentative empirical conclusions, this investigation outlines a fruitful line of inquiry that brings together research on dispersion and coarticulation in order to help explain the dynamics of vowel quality inventories in naturally occurring languages.

Avainsanat - Nyckelord - Keywords
vowel quality, vowel-to-vowel, coarticulation, dispersion, inventory size, Finnish, Kabyle
Säilytyspaikka - Förvaringställe - Where deposited
Faculty of Arts (library) / Department of General Linguistics

Tiedekunta/Osasto - Fakultet/Sektion - Faculty
Humanistinen tiedekunta
Laitos - Institution - Department
Yleisen kielitieteen laitos
Tekijä - Författare - Author
Johanna Mustapää
Työn nimi - Arbetets titel - Title
Petraeuksen kielioppi kulttuurikontekstinsa tuotteena
Oppiaine - Läroämne - Subject
yleinen kielitiede
Työn laji - Arbetets art - Level
Pro gradu
Aika - Datum - Month and year
huhtikuu 2007
Sivumäärä - Sidoantal - Number of pages
84
Ohjaaja(t)
Tarkastajat
Fred Karlsson, Ritva Laury
Tiivistelmä - Referat - Abstract

Tutkielmani tarkoitus on antaa kokonaiskuva Eskil Petraeuksen teoksesta Linguae finnicae brevis institutio (1649), joka on ensimmäinen suomen kielestä ja yleensäkin pohjoismaisesta äidinkielestä laadittu painettu kielioppi, tarkemmin suomen kielen alkeisoppikirja ulkomaalaisille. Aikaisempi tutkimus on pääsääntöisesti käsitellyt vain yhtä teoksen osa-aluetta kerrallaan, yhtenäinen kokonaisesitys on puuttunut. Aikaisemmat tutkimukset eivät ole myöskään käsitelleet teosta kulttuurikontekstissaan.

1600-luvun puhdasoppisesta ja ahdasmielisestä ilmapiiristä sekä kielenkuvauksessa vallalla olleesta latinan kielen mallista huolimatta itsekin suomea vasta aikuisiällä ja vieraana kielenä oppinut Petraeus onnistuu kuvaamaan suomen kieltä ja sen ominaisuuksia monipuolisesti ja ymmärrettävästi.

Tutkielmassani osoitan, että Petraeuksen kielioppi on ollut omana aikanaan kohdeyleisölleen, latinantaitoisille, mutta suomea osaamattomille oppijoille, paitsi ymmärrettävä myös pedagogisesti tarkoituksenmukainen oppikirja. Petraeus siirtää, soveltaa ja luo suomen kielen kuvauksen traditioita, joita vielä nykykieliopeissakin noudatetaan.

Vertaan Petraeuksen suomen kielen kielioppia myös Gabriel Walleniuksen teokseen Project af svensk grammatica (1682), ensimmäiseen ruotsin kielen kielioppiin, tarkemmin sanottuna ruotsin kielen oikeinkirjoitusoppaaseen.

Tutkielmassani osoitan, että Petraeus onnistui suomen kielen kuvauksessaan paremmin kuin Wallenius omassa ruotsin kielen kuvauksessaan, vaikka molemmilla oli taustallaan samanlainen koulutus ja kieliopillinen traditio ja Wallenius kuvasi omaa äidinkieltään.

Avainsanat - Nyckelord - Keywords
Eskil Petraeus, Linguae finnicae brevis institutio, kielitieteen historia
Säilytyspaikka - Förvaringställe - Where deposited
Humanistisen tiedekunnan kirjasto / Yleisen kielitieteen laitos