Yliopiston etusivulle In English
Helsingin yliopisto
Kieli-, puhe- ja käännösteknologian maisteriohjelman tutkintovaatimukset 2005-2007

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 29307

Kpk 300 Kieli-, puhe ja käännösteknologian maisteriohjelman tutkintovaatimukset 2005-2007

Kieli-, puhe- ja käännösteknologian maisteriohjelma

Kieli- puhe- ja käännösteknologian maisteriohjelma (KPK) on kolmen laitoksen, yleisen kielitieteen laitoksen (kieliteknologian oppiaineen), käännöstieteen laitoksen (kieli- ja käännösteknologian oppiaineen) ja puhetieteiden laitoksen (fonetiikan oppiaineen) yhteinen opinto-ohjelma. Kaksi ensin mainittua laitosta on humanistisessa ja kolmas käyttäytymistieteellisessä tiedekunnassa. Maisteriohjelman tavoitteena on tarjota laaja-alaiset tiedot ja taidot kielen automaattisen käsittelyn alalta sekä ammatillisesti suuntautuvia että myös tutkijan uralle tähtääviä varten.

Opintojen rakenne

KPK-maisteriohjelman opinnot koostuvat alla luetelluista osioista. Valmentavia opintoja (1) opiskelija tarvitsee, jos hänen kandidaatintuntkintoonsa ei sisälly tarvittavia maisteriohjelman pakollisten opintojen (2)-(4) esitietoja. Valinnaisten opintojen (6) laajuus määräytyy sen mukaan, miten paljon valmentavia opintoja opiskelija suorittaa.

(1) Kieliteknologian, puheteknologian ja käännösteknologian valmentavat opinnot (2) kieliteknologian teoriat ja menetelmät, (3) puheteknologian teoriat ja menetelmät, (4) käännösteknologian teoriat ja menetelmät, (5) ammatillisuus ja tutkijan taidot, (6) valinnaiset opinnot ja (7) Pro gradu -tutkielma

Opinto-ohjaus, opintojen kulku ja suoritustavat

Maisteriohjelman opiskelijalle nimetään henkilökohtainen opettajatuutori, jonka kanssa opiskelija laatii henkilökohtaisen opintosuunnitelman heti opintojen alkaessa. Opiskelija keskustelee opettajatuutorin kanssa opinnostaan säännöllisesti ja opintosuunnitelma tarkistetaan jokaisen lukuvuoden lopussa.

Opintojen kulku

Tässä taulukossa esitetään pakollisten ja valmentavien opintojen suoritusjärjestys. Paksureunaiset laatikot edustavat pakollisia opintokohteita ja ohutreunaiset laatikot puolestaan joidenkin opiskelijoiden mahdollisesti tarvitsemia kursseja, joilta voi hankkia tarvittavia esitietoja pakollisille kursseille. Nämä aineopintotasoiset suoritukset kirjataan tutkintovaatimuksien kohtaan (1) valmentavat opinnot.

KPK-maisteriohjelman opintojen kulku on havainnollistettu myös erillisenä PDF-muotoisena vuokaaviona

Suoritustavat

Opintokohteet voi suorittaa monella eri tavalla. Tavallisin muoto on luentokurssi ja/tai harjoitukset sekä luentokuulustelu, mutta myös essee, harjoitustyö tai kirjatenttivaihtoehto ovat usein mahdollisia. Suoritustapavaihtoehdot kannattaa tarkistaa opinto-ohjelmasta, josta löytyvät myös opintokohteiden vastuuhenkilöt, joiden kanssa suoritustavasta sovitaan.

Maisteriohjelman opinnot 120 op

Vastuuopettaja: Kimmo Koskenniemi

Täydennetään kieliteknologian, puheteknologian ja käännösteknologian teknisiä ja ammatillisia taitoja, perehdytään alojen sekä niiden lähialojen keskeisiin teorioihin ja malleihin ja hankitaan taito tehdä suunnitelmallista selvitys- ja tutkimustyötä.

(1) "Kieliteknologian, puheteknologian ja käännösteknologian opintoihin valmentavat opinnot" enintään 25 op.

Pakolliset opinnot 40 op

(2) Kieliteknologian teoriat ja menetelmät 9 op

ÄÄRELLISTILAISTEN JÄSENNYSMENETELMIEN TEORIA: Kpk370 (3 op)
Sisältö: Äärellistilaisten automaattien ja transduktorien kalkyyliä ja erilaisten jäsennysmenetelmien toteuttaminen tällaisilla menetelmillä.
Kirjallisuus: Emmanuel Roche and Yves Shabes (eds), Finite-State Language Processing. MIT Press, 1997.
SYNTAKTISTEN JÄSENNYSMENETELMIEN TEORIA: Kpk371 (3 op)
Esitietovaatimukset: Perustiedot jäsentämisestä, esim. kieliteknologian aineopintojen Syntaktiset kielenkäsittelyohjelmat Clt261, ja kieliteknologian aineopintojen Clt271 Kontekstittomat jäsennysmenetelmät tai vastaavat tiedot
Sisältö: Luonnollinen kieli ja formaalikielten teoria, kielioppimalleista (äärellistilaiset, lauseke-, dependenssi-, kategoria- ja piirrekieliopit), jäsennysmenetelmistä (deterministinen vs. nondeterministinen, kokoava vs. karsiva, tulkkaava vs. kääntävä), jäsennyksen vaiheistus, jäsennyssuunnat ja -järjestykset, jäsennyksen vaativuus, kieliopin ja leksikon työnjako, jäsennys vastaan generointi.
TILASTOLLISPOHJAISET JÄSENNYSMENETELMÄT: Kpk350 (3 op)
Esitietovaatimukset: Tilastollisen testaamisen tuntemus, esim. kieliteknologian aineopintojen Clt250 Kielenkäsittelymoduulien evaluointi
Sisältö: Johdatusta ymmärtämään kielen tilastollinen olemus kieliteknologian kannalta eli kielen automaattisen tunnistamisen ja tuottamisen tilastollinen vaativuus. Tilastollisen kieliteknologian merkitys ja sen mahdollisuuksien tunnistaminen niin tämän päivän kuin tulevaisuudenkin sovelluksissa. Kirjoittajan apuvälineiden, vuorovaikutteisten sovellusten, tiedonhaun, kielen oppimisen ja kielen kääntämisen tärkeimmät tilastopohjaiset kieliteknologiset apuvälineet.
Kirjallisuus: Verkkomateriaalia ja oheislukemistona osia teoksista: (1) Christopher D. Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, The MIT Press, 1999, (2) Daniel Jurafsky and James H. Martin, Speech and Language Processing, Prentice Hall, NJ, 2000.

(3) Puheteknologian teoriat ja menetelmät 9 op

PUHESYNTEESI: Kpk321 (3 op)
Esitietovaatimukset: Perustiedot puhesynteesistä, esim. kieliteknologian aineopintojen Clt220 Pyhesynteesin perusteet tai vastaavat tiedot
Sisältö: Tavoitteena on että opiskelija oppii kehittämään eri tekniikoihin perustuvia puhesynteesijärjestelmiä ja käyttämään niiden kehittämiseen käytettäviä työkaluja.
PUHEEN ANALYYSI: Kpk322 (3 op)
Esitietovaatimukset: Fonetiikan peruskurssi. Kansainvälisen foneettisen kirjoituksen tuntemus. Puheen akustiikan perusteet ja esim. Praat-ohjelman harjoituskurssi, jotka molemmat opetetaan esim. osana kieliteknologian perusopintojen kurssia Clt131 Korpusten käsittely.
Sisältö: Kielen fonologisten kategorioiden ja sääntöjen akustisen parametrisaation vastaavuuden tuntemus sekä omakohtainen analyysitaito.
Kirjallisuus: Esim. Harrington, J. & Cassidy, S., Techniques in Speech Acoustics.
PUHESOVELLUSTEN EVALUOINTI: Kpk323 (3 op)
Esitietovaatimukset: Perustiedot puhesynteesistä, esim. kieliteknologian aineopintojen Clt220 Pyhesynteesin perusteet tai vastaavat tiedot sekä tilastollisen testaamisen tuntemus, esim. kieliteknologian aineopintojen Clt250 Kielenkäsittelymoduulien evaluointi tai vastaavat tiedot
Sisältö: Tavoitteena on oppia evaluoimaan erilaisia puheteknologisia sovelluksia.

(4) Käännösteknologian teoriat ja menetelmät 9 op

MONIKIELINEN KIELITEKNOLOGIA: Kpk391 (3 op)
Esitietovaatimukset: Ei esitietovaatimuksia
Sisältö: Katsaus monikielisen kieliteknologian osa-alueisiin ja tieteen tilaan.
MONIKIELISET KORPUKSET: Kpk392 (3 op)
Esitietovaatimukset: Perustiedot ohjelmoinnista, esim. kieliteknologian aineopintojen Clt230 Ohjelmoinnin perusteet tai vastaavat tiedot.
Sisältö: Opitaan käsittelemään monikielisiä kieliaineistoja.
Kirjallisuus: Johansson, S. ja Oksenfjell S. (eds.) Corpora and Cross-Linguistic Research: Theory, Methods and Case Studies. Amsterdam: Rodopi.
KONEKÄÄNNÖS: Kpk393 (3 op)
Esitietovaatimukset: Ei esitietovaatimuksia
Sisältö: Tavoitteena on perehtyä konekäännöksen menetelmiin, sovelluksiin ja laadun arviointiin.
Kirjallisuus: Arnold, D.J., Balkan, L., Meijer, S., Humphreys, L. and Sadler, L., 1994, Machine Translation: an Introductory Guide, London: Blackwells-NCC ja Hutchins, W.H., Machine Translation: Past, Present, Future.

(5) Ammatillisuus ja tutkijan taidot 13 op

SEMINAARI: Kpk340 (10 op)
Sisältö: Laajempien harjoitustöiden ja pro gradu -tutkielman tekijöille, jossa voidaan raportoida suunnitelmia ja työn eri vaiheiden tuloksia ja ongelmia.
HENKILÖKOHTAINEN OPINTOSUUNNITELMA JA TYÖELÄMÄORIENTAATIO: Kpk380 (3 op)
Sisältö: HOPS sisältää syventävien opintojen ja pro gradu-työn suunnittelua sekä vapaastivalittavien opintojen kartoitusta ja valintaa graduaiheen mukaan. Työelämäorientaatio-osion voi suorittaa esim. kursseilla Kpk/Clt 310pro Projektinhallinta (ellei sitä ole sisällytetty HuK-tutkintoon), Kpk/Clt 310ipr Tekijänoikeudet tai Kpk/Clt 310com Teknologian kaupallistaminen tai työkokemuksella kieliteknologian alan projektissa.

(6) Valinnaiset opinnot Vähintään 15 op. Opiskelija, joka tarvitsee vähemmän kuin 25 op valmentavia opintoja, laajentaa valinnaisten opintojen osuutta vastaavalla määrällä. Valinnaiset opinnot voivat edellyttää pakollisten menetelmäkurssien tietoja.

Kieliteknologian alaan liittyviä valinnaisia opintoja, esim:

KIELITEKNOLOGIAN HISTORIA: Kpk310hist (3-5 op)
Sisältö: Perehtyminen kieliteknologian aiempiin vaiheisiin ja merkkipaaluihin.
Kirjallisuus: Joukko verkkosivulla lueteltuja klassikkoartikkeleita ja -kirjoja, sovitaan etukäteen tenttijän kanssa.
ÄÄRELLISTILAISET AUTOMAATIT : Kpk310fs (3-5 op)
Sisältö: Äärellistilaisten automaattien ja transduktorien algebraa, yhdiste, leikkaus, kompositio, determinisointi, minimointi. Erilaisten asioden tekemistä olemassa olevien ohjelmien avulla.
SEMANTIC WEB: Kpk310semw (3-5 op)
Esitietovaatimukset: Java-ohjelmointi, XML, XML Schema, XHTML, relaatiotietokannat ja SQL, esim. Avoimen lähdekoodin kieliteknologia Clt262
Sisältö: W3C-konsortion Semantic Web-aloite koostuu keinoista tehostaa webissä olevan tiedon koneellista hakua ja käsittelyä rakenteisen metadatan avulla. Keskeisiä Semantic Web-tekniikoita ja kuvauskieliä ja niiden yhdistämistä kieliteknologiaan. Semantic Web: XML, metadata ja ontologiat, RDF (Resource Description Framework) ja RDF Schema RDF:n käsittely Javalla: Jena-työkalupakki, RDF:n talletus SQL-tietokannassa: Jenan RDQL-kyselykieli. Ontologiatyö: Protégé ontologiaeditori, ontologiakielet: RDFS, DAML+OIL, OWL, luonnollisen kielen ontologiat: WordNet, OntoWordNet, FrameNet.
KONEOPPIMINEN: Kpk310ml (3-5 op)
Esitietovaatimukset: Kielenkäsittelymoduulien evaluointi, esim. kieliteknologian aineopintojen Clt250, ohjelmoinnin perusteet, esim. kieliteknologian aineopintojen Clt230.
Sisältö: Johdatusta ymmärtämään mitä koneoppiminen voi tarjota kieliteknologian kannalta eli kielen automaattisen tunnistamisen ja tuottamisen sovittaminen eri käyttötilanteisiin. Johdanto koneoppimiseen kieliteknologiassa: ohjattua oppimista (aineiston luokittelu esimerkkien perusteella), puoliohjattua oppimista (aineiston luokittelu siemenesimerkkien perusteella), puoliohjaamatonta oppimista (aineiston ryhmittely tai visualisointi viiteaineiston mukaan), ohjaamatonta oppimista (aineiston ryhmittely tai visualisointi suoraan). Koneoppimisen hyödyntäminen kirjoittajan apuvälineiden, vuorovaikutteisten sovellusten, tiedonhaun, kielen oppimisen ja kielen kääntämisen tärkeimmissä kieliteknologisissa apuvälineissä.
Kirjallisuus: Verkkomateriaalia ja oheislukemistona osia teoksista: (1) Ruslan Mitkov (ed.), The Oxford Handbook of Computational Linguistcs, Oxford University Press, 2003, (2) Daniel Jurafsky and James H. Martin, Speech and Language Processing, Prentice Hall, NJ, 2000. (3) Christopher D. Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, The MIT Press, 1999.
LUONNOLLISEN KIELEN GENEROINTI: Kpk310gen (3-5 op)
Esitietovaatimukset: Java-ohjelmointi, XML, XML Schema ja XSLT esim. Clt230, Java, Ant, SQL, WordNet, esim. Clt262, yleisen kielitieen perustiedot: morfologia, syntaksi, semantiikka, esim. Clt110
Sisältö: Tutustuminen luonnollisen kielen tuottamiseen: ongelmat, tekniikat, tehtävät, arkkitehtuurit, tekstin ja dialogin generointi. Johdatus generointiin, generointiarkkitehtuurit, generointivaiheet, templaattipohjainen generointi, pinta-ja syvägenerointi, XML-pohjainen generointi, dialogin generointi.
KORPUKSET JA KIELI: Kpk310corp (3-5 op)
Esitietovaatimukset: Ei esitietovaatimuksia
Sisältö: Kurssin tavoitteena on kokemusperäisesti tarkastella, miten korpuksia voidaan käyttää kielen tutkimuksessa, minkälaisia tutkimuskysymyksiä korpuksille kannattaa esittää, miten korpuksia kannattaa tutkia sekä mitä tulosten pohjalta voidaan sanoa kielestä.

Puheteknologian alaan liittyviä valinnaisia opintoja, esim:

PUHEKORPUKSET: Kpk310sc (3-5 op)
Esitietovaatimukset: Puheaineistojen tuntemus esim. kieliteknologian aineopintojen Clt222 Puheaineistot tai vastaavat tiedot.
Sisältö: Digitaalisten puheaineistojen rakenteisiin liittyvät teoriat ja menetelmät, erityisesti annotointiskeemojen (esim. relaatiograafit, annotaatiograafit) vertailu ja pohdinta skeeman valinnan vaikutuksista aineiston analysoitavuuteen.
PUHUJANTUNNISTUS: Kpk310skr (3-5 op)
Esitietovaatimukset: Kuten kohdassa Kpk322
Sisältö: Idiolektisten (puhujakohtaisten) piirteiden ilmeneminen akustisesti.
Kirjallisuus: Sovittavassa laajuudessa: Rose, P., Forensic Speaker Identification
PUHEEN AUTOMAATTINEN TUNNISTAMINEN: Kpk310sr (3-5 op)
Esitietovaatimukset: Kuten kohdassa Kpk322
Sisältö: Tutustuminen erilaisiin puheen automaattisen tunnistamisen ratkaisumalleihin.
Kirjallisuus: Sovittavassa laajudessa uudempia kongressi- ja aikakauslehtiartikkeleita.

Käännösteknologian alaan liittyviä valinnaisia opintoja, esim:

DIALOGIN HALLINTA: Kpk310dia (3-5 op)
Esitietovaatimukset: Kieliteknologian perusopinnot
Sisältö: Keskustelu vs. dialogi, keskustelujen litterointi, dialogin mallintaminen, tutustuminen dialogin mallinnusta kehittäviin projekteihin (esim. Interact).
Kirjallisuus: M.McTear: Spoken Dialogue Technology: Enabling the Conversational User Interface
TIETOKONEAVUSTEINEN KIELEN OPPIMINEN : Kpk310call (3-5 op)
Esitietovaatimukset: Yleisen kielitieteen perustiedot: morfologia, syntaksi, semantiikka, esim.Clt110 sekä perustiedot ohjelmoinnista, esim Clt230
Sisältö: Tutustuminen kielen opettamisen kieliteknologiaan: ongelmat, tekniikat, tehtävät, ratkaisut, CALL:in historia, CALL:iin soveltuvat kieliteknologiat, olemassaolevat CALL-ratkaisut, alan tutkimuksen nykytila ja mahdollisuudet
FORMAALI KIELITYPOLOGIA: Kpk310fty (3-5 op)
Sisältö: Perehdytään kielten välisen vertailun teoriaan ja typologisiin malleihin.
Kirjallisuus: Foley, W.A. amd Van Valin Jr., D. Functional syntax and universal grammar. Cambridge University Press, Croft. W. Radical Construction Grammar, Oxford University Press.
ONTOLOGIAT: Kpk310ont (3-5 op)
Sisältö: Ontologiastandardit ja työkalut ja näiden sovellukset semantiikkaan ja terminologiaan.
Kirjallisuus: Sowa, J.F., Knowledge Representation: Logical, Philosophical and Computational Foundations, Brooks Cole Publishing Co.

Ammattiin orientoitumiseen liittyviä vlinnaisia opintoja, esim:

TEKIJÄNOIKEUDET: Kpk310ipr (3-5 op)
Esitietovaatimukset: Ei varsinaisia esitietovaatimuksia. Tarkoitettu syventäviä opintoja suorittaville, joten opiskelijoilla oletetaan olevan perustiedot yleisimmistä kieliteknologisista sovelluksista ja aiheen kannalta relevanteista lingvistisistä menetelmistä.
Sisältö: Tavoitteena on perehdyttää opiskelija immateriaalioikeuden järjestelmään ja keskeisiin käsitteisiin yleisellä tasolla sekä antaa valmiuksia soveltamaan immateriaalioikeutta kieliteknologin tai lingvistin tyypillisesti kohtaamissa käytännön tilanteissa. Tekijänoikeus ja lähioikeudet, teollisoikeudet, immateriaalioikeudet ja korpukset, internet, kieliteknologiatuotteet ja tutkimus.
PROJEKTINHALLINTA: Kpk310pro (3-5 op)
Esitietovaatimukset: Ei esitietovaatimuksia, mutta luentomateriaaliin etukäteen tutustumista suositellaan.
Sisältö: Kurssin tavoitteena on antaa yleiskuva siitä, mitä projektit ovat, minkälaista on työskennellä projekteissa, ja miten projekteja suunnitellaan, seurataan ja johdetaan. Kurssilla näkökulmana on kieliteknologin työuralle tyypillinen projektitoiminta.
TEKNOLOGIAN KAUPALLISTAMINEN: Kpk310com (3-5 op)
Esitietovaatimukset: Ei esitietovaatimuksia
Sisältö: Tavoitteena on tarkastella kieliteknologisen ja kielitieteellisen teorian kaupallistamiseen ja tuotteistamiseen liittyviä erityiskysymyksiä ja antaa yleiskuva kieliteknologiaan pohjautuvasta liiketoiminnasta Suomessa, Pohjoismaissa ja muualla maailmassa. Kaupallinen kieliteknologia käytännössä, Suomessa ja muissa Pohjoismaissa, kieliteknologiset tuotekehitysprojektit, kaupallisen kieliteknologian tulevaisuus: mahdollisuudet ja karikot.
Kirjallisuus: Naumanen, Mika 2002. Nuorten teknologiayritysten menestystekijät. SITRAn raportteja sarja, ISSN 1457-5728; 28. Edita Publishing Oy, Helsinki.
MUU KIELITEKNOLOGIAN, PUHETEKNOLOGIAN TAI KÄÄNNÖSTEKNOLOGIAN ERIKOISKURSSI: Kpk310 (3-5 op)
Sisältö: Yleisen kielitieteen, puheteknologian, fonetiikan, käännösteknologian, muiden yhteistyölaitosten tai KIT-verkoston opintoja sopimuksen mukaan.

(7) Pro gradu -tutkielma 40 op

PRO GRADU-TUTKIELMA: Kpk800 (40 op)
Sisältö: Pro gradu -tutkielman tulee osoittaa pääaineopiskelijan kykyä ymmärtää ja soveltaa kieliteknologisia menetelmiä. Tutkielman pituus on tavallisesti 40-70 sivua. Tutkielman suunnitelma aikatauluineen tulee hyväksyttää ohjaajalla, jotta työn edistyminen voidaan varmistaa. Kieliteknologiassa on pyrkimys siihen, että huomattava osa tutkielmista voitaisiin tehdä palkallisina yrityksissä tai tutkimushankkeissa.