Yliopiston etusivulle In English
Helsingin yliopisto
Nykykielten laitos: Kieliteknologian oppiaine

Yhteystiedot

Nykykielten laitos

PL 24 (Unioninkatu 40)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 28313

Kieliteknologian tutkintovaatimukset 2001-2003

Ennen vuotta 2005 aloittaneiden opiskelijoiden on mahdollista suorittaa tutkintonsa näiden tutkintovaatimusten mukaisesti vuoteen 2008 mennessä.

Kieliteknologia tutkii, kehittää ja soveltaa menetelmiä luonnollisen kielen käsittelyä varten. Ihmiset viestivät ja varastoivat tietoa, kokemusta ja ymmärrystä tavallisesti kielen avulla, siis puheena tai tekstinä. Pidämme ensi näkemältä kieltä yksinkertaisena ja itsestään selvänä. Todellisuus osoittautuu kuitenkin toisenlaiseksi: vaikka kielessä on säännönmukaisuuksia, se on samalla myös hyvin moniselitteistä. Tämä paljastuu koko laajuudessaan, kun kieliteknologiassa yritämme opettaa tai ohjelmoida kielen tunnistamista tai tuottamista tietokoneelle. Luonnollisten kielten (kuten suomen tai englannin) kuvaaminen jäsentämistä ja tunnistamista varten vaatii kohteena olevan kielen ja sen rakenteen hyvää hallintaa. Kieliteknologia sisältää myös laskennan kannalta hyvin haasteellisia tehtäviä. Kieliteknologia onkin mielekäs ala ja innostava yhteistyökenttä kielestä kiinnostuneille sekä humanistisesti että teknisesti suuntautuneille opiskelijoille.

Kieliteknologia on toinen yleisen kielitieteen laitoksen oppiaineista. Aineen puitteissa hankitaan monitieteiset perustiedot alasta ja sen menetelmistä ja erikoistutaan jollekin kieliteknologian monista sovellusalueista, joita ovat esimerkiksi:

  • tietokoneavusteinen kielenoppiminen ja -opettaminen,
  • välineet kielenkääntämisen tueksi sekä automaattiset kielenkääntöohjelmat ja tietokoneohjelmien sopeuttaminen eri kielten ja kulttuurien mukaisiksi,
  • erilaiset kirjoittajan apuvälineinä toimivat tietokoneohjelmat, kuten oikeinkirjoituksen ja oikeakielisyyden tarkistus, tavutus jne.,
  • luonnollisen kielen käyttö tietokoneen käyttöliittymissä,
  • dokumenttien etsintä, tiedonhaku vapaamuotoisista teksteistä, tekstien indeksointi, tekstin tiivistelmän automaattinen tuottaminen tai
  • puhesynteesi ja automaattinen puheentunnistus.

Tietokoneistumisen ja tietoverkkojen yleistymisen vuoksi on saatavilla olevan tiedon määrä räjähdysmäisesti kasvanut ja sen vuoksi oppiaineesta valmistuvat maisterit ovat kysyttyjä nopeasti kasvavilla kieliteknologian työmarkkinoilla. Pyrkimyksenä on, että useimmat opiskelijat tekisivät pro gradu -työnsä palkallisena yritysmaailmassa, mahdollisessa tulevassa työpaikassaan.

Sovellusten lisäksi voidaan erikoistua myös kieliteknologian menetelmiin, niiden kehittämiseen ja tutkimukseen. Kieliteknologiassa on meneillä useita tutkimus- ja sovellushankkeita osana laaja-alaista valtakunnallista tutkimusohjelmaa. Tutkimushankkeisiin saattaa päästä mukaan jo aineopintovaiheessa. Valmistuvat maisterit voivat pyrkiä tohtorikoulutukseen jatko-opiskelijoiksi. Jatkotutkintokoulutusta järjestetään myös pohjoismaisena yhteishankkeena.

Opetuksen laajentamiseksi on perustettu useiden laitosten ja korkeakoulujen yhteistyönä kieliteknologian opetuksen (KIT) verkosto, jonka opetuksesta saa parhaiten tietoa sen kotisivulta http://www.ling.helsinki.fi/kit/

Verkosto on valtakunnallinen ja siihen kuuluu laitoksia ja laboratorioita kymmenestä yliopistosta, joiden joukossa on kaksi teknillistä korkeakoulua ja taideteollinen korkeakoulu. Verkoston tavoitteena on laajentaa ja kehittää kieliteknologian yliopisto-opetusta nykyistä ja tulevaa työvoimatarvetta vastaavaksi. Tähän pyritään toisaalta liittämällä kieliteknologian opetusta ja arvosanoja kieliteknologiaa hyödyntävien lähialojen tutkintoihin ja toisaalta laajentamalla kieliteknologian pääaineopetusta. Opetusministeriö rahoittaa verkoston toimintaa vuosina 2001-2003 erityisellä hankerahoituksella. KIT-verkosto tarjoaa mahdollisuuden suorittaa useisiin oppiaineisiin hyvin soveltuvia yksittäisiä KIT-kursseja sekä monipuolisia sivuaineopintokokonaisuuksia.

Kieliteknologia antaa myös kielitieteessä tarvittavan tietotekniikan opetusta tiedekunnan kaikkien kieliaineiden opiskelijoille. Tällaisia kursseja ovat Ctl130, Ctl160 ja Ctl121 sekä sopimuksen mukaan muut soveltuvat kurssit, esimerkiksi Ctl310pro.

Kieliteknologian pääaineopinnot muodostuvat oppiaineen perus-, aine- ja syventävistä opinnoista sekä pro gradu -tutkielmasta.

  • Perusopinnot voivat olla 15-35 ov laajuiset, mutta ovat normaalisti noin 20 ov.
  • Aineopinnot ovat yhdessä perusopintojen kanssa 35-60 ov, yleensä noin 40 ov, ja opinnoista vähintään 15 ov on oltava aine- tai syventävien opintojen tasoisia suorituksia.
  • Syventävät opinnot ovat yhdessä aine- ja perusopintojen kanssa 55-80 ov, yleensä noin 60 ov, joista pitää olla syventävien opintojen tasoisia suorituksia vähintään 20 ov.

Tietojenkäsittelytieteen sivuaineopintoja edellytetään pääaineopiskelijan maisterintutkinnossa vähintään 15 ov, tavallisesti 25 ov laajuisina (perusopinnot eli approbatur-oppimäärä). Kieliaineista siirtyjät voivat suorittaa erikoistumisalansa mukaan suppeamman opintokokonaisuuden. Suositeltavaa on suorittaa tästä aineesta myös 35 ov laajuiset aineopinnot (cum laude -oppimäärä, sisältää approbaturin). Aiottu erikoistumissuunta kannattaa ottaa huomioon tietojenkäsittelytieteen opintoja valittaessa. Tietojenkäsittelytieteen kursseja voidaan sopimuksen mukaan sisällyttää myös kieliteknologian arvosanoihin.

Yleisen kielitieteen perusopinnoista voi suoraan jatkaa kieliteknologian aineopintoihin. Opiskelija, joka haluaa erikoistua sekä yleiseen kielitieteeseen että kieliteknologiaan, voi ottaa kieliteknologian yleisen kielitieteen sivuaineeksi ja päinvastoin, kunhan samansisältöisiä kursseja ei sisällytetä opintokokonaisuuksiin. Vaihtoehtoisesti voi yleisen kielitieteen kursseja sisällyttää melko runsaasti kieliteknologian opintoihin. Kieliteknologian perusopintoihin sisältyy joukko metodikursseja sekä kieliteknologiaa esittelevä kurssi, kuten jäljempänä luetellaan. Opiskelija, joka on suorittanut yleisen kielitieteen perusopinnot, sijoittaa nämä kurssit kieliteknologian aineopintojen alkuun, sikäli kuin niitä ei ole suoritettu muiden opinto-kokonaisuuksien osina (näinä tai vastaavansisältöisinä kursseina). Muusta aineesta kieliteknologian pääaine-opiskelijaksi hakeutuvan kannattaa varautua ajoissa siihen, että kieliteknologian tutkintoon sisältyy sivuaineena tietojenkäsittelyä ainakin perusopintojen verran. Tutkinnossa on hyvä olla myös jonkin laajuisia yleisen kielitieteen opintoja. ja usein myös paljon kielitiedettä. Pääaineopiskelijana opinnot aloittavan kannattaa ottaa näitä aineita opinto-ohjelmaan jo alusta alkaen, jotta opinnot sujuisivat helpommin.

Kieliteknologian sivuainearvosanaa suorittavat voivat myös KIT-verkoston puitteissa suorittaa yksittäisiä kursseja sisällytettäväksi arvosanaan. Kieliteknologian pääaineopiskeijat voivat suorittaa KIT-erikoistumiskursseja siten, kun jäljempänä kuvataan, tai sisällyttää tutkintoonsa KIT-kursseista muodostuvan puoliarvosanan tai perus- tai aineopintojen laajuisen sivuaineen.

Ctl101 Puoliarvosana

(10-14 ov) 490050-4

Puoliarvosana on tarkoitettu muiden Helsingin yliopiston laitosten sekä KIT-verkoston opiskelijoille, jotka eivät aio suorittaa täyttä perusopintojen sivuainearvosanaa. Puoliarvosanaa varten tulee suorittaa perusopinnoista kohta Ctl190 sekä suunnitellun kokonaisuuden sisältämien kurssien edellyttämät kurssit.

Opintojen rakenne

Tässä kuvattujen varsinaisten perus- aine- ja syventävien opintojen laajuus ja suoritusten vaatimukset kuvataan yksityiskohtaisemmin alempana. Yksilöllinen sopiminen opintokokonaisuuksien muodostamisessa on mahdollista perus- ja aineopinnoissa mutta tarpeen erityisesti syventävissä. Yhdistelmistä ja mahdollisista muutoksista suunnitelmiin on syytä sopia etukäteen opintokokonaisuuden koostamisesta vastaavan professorin kanssa.KIT-verkoston kurssitajonnan lisääntyessä voi sellaisiakin vaatimuskohtia suorittaa myös KIT-verkostossa, joiden kohdalla tätä mahdollisuutta ei ole erikseen kuvauksessa mainittu. KIT-verkoston tarjonnasta ilomoitetaan erikseen.

Ctl100 Perusopinnot

(1) Kielitiedettä kieliteknologiaa varten
(2) Teknisiä taitoja kieliteknologiaa varten
(3) Johdatus kieliteknologiaan
(4) Valinnaisia opintoja

Ctl200 Aineopinnot

(5) Kieliteknologian ammattitaitoja
(6) Kieliteknologian menetelmät
(7) Tutkijan taidot
(8) Valinnaisia opintoja

Ctl300 Syventävät opinnot

(9) Kieliteknologian tutkimus
(10) Valinnaisia opintoja

Ctl800 Pro gradu-tutkielma

Kurssien välisistä riippuvuuksista

Kurssien välisiä riippuvuuksia on kahdenlaisia: suosituksia ja vaatimuksia. Ohessa pdf-muotoisessa kaaviossa näet kieliteknologian kurssien riippuvuudet. Paksu nuoli tarkoittaa pakollisuutta, katkoviiva valinnaisuutta.

  • Kaavio PDF-muodossa
  • Kaavio PS-muodossa

Ctl100 Perusopinnot

(15-35 ov, tav. 20 ov) 490100-8

Osioiden 1-3 laajuus on lähtökohtaisesti vähintään 5 ov, mutta ne voivat supistua silloin, kun niiden osia on suoritettu muiden opintojen osana. Tällöin osiossa 4 olevia valinnaisia kursseja voi ottaa vastaavasti enemmän.

(1) Kielitiedettä kieliteknologiaa varten vähintään 5 ov siten, että kohdat (a) ja (b) ovat pakollisia ja vähintään kolme kohdista (c), (d), (e) tai (f) sisältyy osioon:

(a) Ctl102 Yleisen kielitieteen perusteet kieliteknologeille (1 ov) 490102-4
Voidaan suorittaa yleisen kielitieteen peruskurssilla Cyk110, ks. yleinen kielitiede.
(b) Ctl103 Fonetiikan perusteet kieliteknologeille (1 ov) 490103-7
Voidaan suorittaa fonetiikan peruskurssilla Vfo115, ks. fonetiikka tai KIT-kurssina, ks. KIT-verkoston www-sivu. Puheteknologian sovelluksiin suuntautuva johdatus fonologiaan. Vastuuhenkilö: Martti Vainio.
(c) Ctl104 Morfofonologian harjoitukset (1 ov) 490104-0
Edellyttää kielitieteen perusteita, esim. Ctl102. Harjoitukset voi suorittaa yleisen kielitieteen harjoituskurssilla Cyk130, ks. yleinen kielitiede tai KIT-verkoston ohjattuna itsenäisenä opiskeluna, ks. KIT-verkoston www-sivu. Vastuuhenkilö: prof. Carlson.
(d) Ctl105 Morfosyntaksin harjoitukset (1 ov) 490105-3
Edellyttää kielitieteen perusteita, esim. Ctl102. Harjoitukset voi suorittaa yleisen kielitieteen harjoituskurssilla Cyk140 tai KIT-verkoston ohjattuna itsenäisenä opiskeluna, ks. KIT-verkoston www-sivu. Vastuuhenkilö: prof. Carlson.
(e) Ctl106 Semantiikan ja pragmatiikan harjoitukset (1 ov) 490106-6
Edellyttää kielitieteen perusteita, esim. Ctl102. Harjoitukset voi suorittaa yleisen kielitieteen harjoituskurssilla Cyk150 tai KIT-verkoston ohjattuna itsenäisenä opiskeluna, ks. KIT-verkoston www-sivu. Vastuuhenkilö: prof. Carlson.
(f) Ctl107 Fonetiikan harjoitukset (1 ov) 490107-9
Edellyttää fonetiikan perusteita, esim. Ctl103. Harjoitukset voi suorittaa fonetiikan harjoituskurssilla Vfo116, ks. fonetiikka tai KIT-verkoston ohjattuna itsenäisenä opiskeluna, ks. KIT-verkoston www-sivu. Vastuuhenkilö: Martti Vainio.

(2) Teknisiä taitoja kieliteknologiaa varten vähintään 5 ov siten, että kohdat (a) ja (b) ovat pakollisia ja ainakin yksi kursseista (c), (d) tai (e) sisältyy osioon. Pääaineopiskelijoiden on yleensä syytä suorittaa kohta (c), joka suoritetaan aivan opintojen alussa.

(a) Ctl130 UNIX-kyttjrjestelmn alkeet (1 ov) 490130-9
Ei edellytetä aiempia ATK-taitoja. Antaa alustavat taidot Unix-käyttöjärjestelmän käyttämiseksi. Vastuuhenkilö: prof. Koskenniemi.
(b) Ctl160 Tekstikorpusten tietojenksittely (2 ov) 490160-0
Edellyttää unix-järjestelmän alkeita, esim. Ctl130. Opitaan laatimaan tietokonemuotoisia tekstiaineistoja, muokkaamaan niitä, sekä etsimään esimerkkejä tietokonemuotoisista teksteistä. Osa materiaalista esim. kirjoissa B. Kernighan, R. Pike The UNIX Programming Environment, D. Cameron, B. Rosenblatt Learning GNU Emacs, R. Schwartz Learning Perl. Kurssi sopii myös kieliaineiden opiskelijoille. Vastuuhenkilö: prof. Koskenniemi.
(c) Ctl120 Matematiikan perusteita kieliteknologeille (2 ov) 490120-2
Ei edellytä erityisiä matematiikan esitietoja, mutta ne ovat tarpeen mm. tietojenkäsittelytieteen sivuaineopintoja varten. Suoritettava aivan opintojen alussa. Luennot ja harjoituksia. Materiaali löytyy pääosin kirjasta B. Partee, A. ter Meulen, R. Wall Mathematical Methods in Linguistics tai monisteesta J. Merikoski, A. Virtanen, P. Koivisto Diskreetti matematiikka I. Vastuuhenkilö: prof. Koskenniemi.
(d) Ctl121 Kieliaineistojen tilastomenetelmi (2 ov) 490121-5
Peruskäsitteet ja käytännön menetelmät tekstiaineistojen tilastolliseen käsittelyyn. Kirjatentissä esim. T. McEnery, A. Wilson, Corpus linguistics, D. Biber, S. Conrad, R. Reppen Corpus linguistics, R. Garside, G. Leech, T. McEnery Corpus annotation, M. Oakes Statistics for Corpus Linguistics. Kurssi sopii myös kieliaineiden opiskelijoille. Vastuuhenkilö: prof. Koskenniemi.
(e) Ctl122 Matematiikan perusteita puheteknologiaa varten (2 ov) 490122-8
Edellytykset kieli- ja puheteknologian tilastollisten ja koneoppimismenetelmien ymmärtämiseen. Kirjallisuutta: J. Tou, R. Gonzales Pattern Recognition Principles, L. Rabiner, B.-H. Juang Fundamentals of Speech Recognition, Robert J. Schalkoff Pattern Recognition: Statistical, Structural, and Neural Approaches, S. Theodoridis, K. Koutroumbas Pattern Recognition. Vastuuhenkilö: prof. Koskenniemi.

(3) Johdatus kieliteknologiaan, pakolliset suoritukset vähintään 5 ov:

(a) Ctl190 Kieliteknologian johdantokurssi (2 ov) 490190-1
Edellyttää yleisen kielitieteen perusteita, esim. Ctl102 ja unix-järjestelmän alkeita, esim. Ctl130. Kieliteknologian mahdollisuudet, sovellukset ja menetelmät. Vastuuhenkilö: prof. Koskenniemi.
(b) Ctl191 Kieliteknologian johdantokurssin harjoitukset (2 ov) 490191-4
Vastuuhenkilö: prof. Koskenniemi.
(c) Ctl192 Kieliteknologian johdantokurssin essee (1 ov) 490192-7
Kirjallisuutta esseetä varten, esim. R. Cole ym. (toim.) Survey of the State of the Art in Human Language Technology sekä E. Hyvönen ym. (toim.) Tekoälyn ensyklopedia. Vastuuhenkilö: prof. Koskenniemi.

(4) Valinnaisia opintoja, perusopintojen laajuudesta riippuen esim. seuraavia, mutta myös esim. aineopintojen tai KIT-suorituksia. Tarjonnasta ilmoitetaan erikseen.

  • Kieliteknologia, erityisesti pääaineopiskelijoille, lähinnä seuraavat kaksi ja/tai aineopintojen erikoiskursseja
Ctl132 Automaattinen fonologinen ja morfologinen analyysi (2 ov) 490132-5
Edellyttää kieliteknologian johdantokurssia Ctl190 sekä fonologian harjoituksia, esim. Ctl104. Luentokurssi tai kirjatentti, R. Sproat Morphology and Computation; artikkeleita. Vastuuhenkilö: prof. Koskenniemi.
Ctl142 Automaattinen syntaktinen analyysi (2 ov) 490142-2
Edellyttää kieliteknologian harjoituskurssia Ctl190 ja syntaksin harjoituksia Ctl105. Luentokurssi tai kirjatentti, esim. F. Karlsson, A. Voutilainen, J. Heikkilä, A. Anttila (toim.) Constraint grammar, osia; artikkeleita. Vastuuhenkilö: prof. Koskenniemi.
Ctl180 Muu kieliteknologian erikoiskurssi
  • Puheteknologia, esimerkiksi seuraavia kursseja fonetiikasta tai vastaavia muualta KIT-verkostosta:
Vfo121 Johdanto puheen akustiikkaan (1 ov)
Ks. fonetiikka
Vfo254 Puhekorpusten ksittely (2 ov)
Ks. fonetiikka ja KIT-verkoston www-sivut.
Vfo133 Menetelmkurssi (2 ov)
Ks. fonetiikka sekä Fonetiikan praktikum-kurssi, KIT-verkoston www-sivut.
Ctl181 Muu puheteknologian erikoiskurssi
  • Kielenoppimisen teknologia, kursseja KIT-verkostosta, erityisesti Jyväskylästä, esim.
Ctl182a Kielenoppimisen teoriaa kieliteknologeille (1-2 ov)
Ks. KIT-verkoston www-sivut.
Ctl182b Johdatus kielitaidon arviointiin (1-2 ov)
Ks. KIT-verkoston www-sivut.
Ctl182c Kielenopetuksen materiaalin tuotanto (1-2 ov)
Ks. KIT-verkoston www-sivut.
Ctl182 Muu kielenoppimisen teknologian erikoiskurssi
  • Monikielisen viestinnän teknologia, kursseja MonAKO:sta ja KIT-verkostosta, esim.
Cak134 AV-kntminen (1 ov)
Sisältyy MonAKO:n tarjontaan. Vastuuhenkilö: prof. Carlson.
Cak116 Tietokoneavusteinen kntminen (1 ov)
Sisältyy MonAKO:n tarjontaan. Vastuuhenkilö: prof. Carlson.
Cak125 Tietokoneavusteisen kntmisen harjoituskurssi (1 ov)
Sisältyy MonAKO:n tarjontaan. Vastuuhenkilö: prof. Carlson.
Cak118 Tietokoneavusteinen terminologia (1-2 ov)
Sisältyy MonAKO:n tarjontaan. Vastuuhenkilö: prof. Carlson.
Ctl183 Muu monikielisen viestinnn teknologian erikoiskurssi
  • Tiedonhaku, kursseja KIT-verkostosta, erityisesti Tampereelta, esim.
Ctl184ir Tiedonhaun menetelmt (2 ov)
Ks. KIT-verkosto Antaa yleiskuvan dokumenttien ja tietokantojen rakenteesta, tiedonhakumalleista, tiedonhaun evaluoinnista ja tiedonhaun tutkimuksen suuntauksista. Kirjallisuus: Buckland Information and information systems, Kuhlthau Seeking meaning, Choo, Information management for the intelligent organization. Vastuuhenkilö: prof. Koskenniemi.
Ctl184 Muu tiedonhaun erikoiskurssi
  • Muut erikoisalat, esim. kursseja KIT-verkostosta, ks. verkoston www-sivut.
Ctl189 Muu erikoisalan kurssi

Ctl200 Aineopinnot

(35-60 ov) 490200-7

Vähintään hyvin tiedoin suoritetut perusopinnot joko kieliteknologiassa tai yleisessä kielitieteessä (15-25 ov). Kieliteknologian perusopintojen osioiden 1-3 vaatimukset edellytetään kummassakin tapauksessa. Sen vuoksi yleisen kielitieteen perusopinnoista kieliteknologian aineopintoihin jatkava suorittaa kieliteknologian perusopintojen kohdat 2-3 kieliteknologian aineopintojen valinnaisina opintoina (kohta 8 alla).

(5) Kieliteknologian ammattitaitoja, väh. 5 ov

Ctl210 Rakenteisten dokumenttien ksittely (3 ov)
mm. Emacs-editorin käyttö, isojen tiedostojen käsittely, Perl-skriptit, morfologisten analyysiohjelmien tulosten hyödyntäminen, LaTeX-dokumentin tekeminen, SGML-dokumentin tekeminen, Unixin Make, versionhallinta, HTML, SGML, XML. Vastuuhenkilö: prof. Koskenniemi.
Ctl211 Ohjelmoinnin perusteet kieliteknologeille (2 ov) 490211-7
Tavoitteena ohjelmoinnin perusrakenteiden (mm. tietotyypit, kontrollirakenteet, silmukat, aliohjelmat, syöttö ja tulostus) ja hyvän ohjelmointitavan omaksuminen. Ohjelmointikielenä Perl. Vastuuhenkilö: prof. Koskenniemi.
Ctl270 Prolog-ohjelmointikieli (2 ov) 490170-7
Edellyttää perustaitoja matematiikasta esim. Ctl120, Unix-järjestelmän käytöstä, esim. Ctl130 sekä ohjelmoinnin perusteita, esim. Ctl211. Prolog-ohjelmointikielen käyttäminen. Vastaa osia esim. kirjoista W.F. Clocksin, C.S. Mellish Programming in Prolog, L. Sterling, E. Shapiro The Art of Prolog, F. Pereira, S. Shieber Prolog and Natural-Language Analysis. Voidaan suorittaa esim. tietojenkäsittelytieteen symbolisen ohjelmoinnin kurssilla. Vastuuhenkilö: prof. Koskenniemi.
Ctl271 Lisp-ohjelmointikieli (1 ov) 490271-9
Edellyttää ohjelmoinnin perusteita, esim. Ctl211. Lisp-ohjelmoinnin perusteet. Voidaan suorittaa esim. tietojenkäsittelytieteen symbolisen ohjelmoinnin kurssilla. Vastuuhenkilö: prof. Koskenniemi.

(6) Kieliteknologian menetelmät, 4-6 ov

Ctl253 rellisten tilojen jsennysmenetelm (2 ov) 490253-1
Edellyttää matematiikan perustietoja, esim. Ctl120, unix-järjestelmän perusteita, esim. Ctl130, Prolog-ohjelmointia, esim. Ctl270, tietojenkäsittelytieteen perustietoja sekä syntaksin, morfologian ja fonologian riittäviä tietoja, esim. Ctl106, Ctl104 ja Ctl105. Kieliteknologian tärkeimmät jäsennysalgoritmit ja käsittelymenetelmät. Kirjallisuutta: osia esim. D. Jurafsky, J. Martin Speech and Language Processing, G. Gazdar, C. Mellish Natural Language Processing in Prolog, S. Shieber An Introduction to Unification-based Approaches to Grammar, C. Pollard, I. Sag Information-Based Syntax and Semantics, R. Sproat Morphology and Computation. Vastuuhenkilö: prof. Koskenniemi.
Ctl254 Kontekstittomat jsennysmenetelmt (2 ov) 490254-4
Edellyttää Prolog-ohjelmointikieltä, esim. Ctl270. Vastuuhenkilö: prof. Koskenniemi.
Ctl255 Kieliteknologian tilastomenetelmt (2 ov) 490255-7
Edellyttää kieliaineistojen tilastomenetelmien peruskurssia, esim. Ctl121. Tilastollisten menetelmien käyttö kieliteknologiassa. Ch. Manning, H. Schütze Foundations of Statistical Natural Language Processing. Vastuuhenkilö: prof. Koskenniemi.

(7) Tutkijan taidot sekä suullinen ja kirjallinen esitys, 2-4 ov, pääaineopiskelijoille (a) ja (b) pakollisia, sivuaineopiskelijoille (a) valinnainen:

(a) Ctl292 Proseminaari (2 ov) 490292-6
Esitelmä, posteri tai verkkosivu. Pääaine-opiskelijoille kandidaatintutkielman suunnittelu ja suunnitelman esittely. Vastuuhenkilö: prof. Carlson.
(b) Ctl290 Kirjallinen ty (2 ov) 490290-0
Esim. tekstikorpusten tietojenkäsittelyyn liittyvä itsenäinen työ ja siitä tehty n. 20 sivun kirjallinen raportti. Pääaineopiskelijan proseminaari (2 ov) ja kirjallinen työ (2 ov) hyväksytään kandidaatin-tutkielmaksi, jonka aihepiiristä kirjoitetaan kypsyysnäyte. Sivuaineopiskelijalle proseminaari on vapaaehtoinen. Vastuuhenkilö: prof. Carlson.

(8) Valinnaisia opintoja, 5-9 ov
Erikoistumissuunnasta voi suorittaa alan kirjallisuutta erillisen luettelon tai sopimuksen mukaan tenttimällä tai essein. Esim.

  • Puheteknologia, kursseja fonetiikasta tai KIT-verkostosta, esim.
Vfo235 Puheen havaitseminen (2-3 ov)
Ks. fonetiikka ja Auditiivinen fonetiikka KIT-verkoston tarjonnassa.
Vfo242 Puheen tuottaminen (2-3 ov)
Ks. fonetiikka ja Artikulatorinen fonetiikka KIT-verkoston tarjonnassa, ks. KIT-verkoston www-sivut.
Vfo251 Puhesynteesin perusteet (2-3 ov)
Ks. fonetiikka
Ctl281a Puheentunnistuksen perusteet (2 ov)
Ks. KIT-verkoston www-sivut. Vastuuhenkilö: Martti Vainio.
Ctl281 Muu puheteknologian erikoiskurssi
  • Kielenoppimisen teknologia, kursseja KIT-verkostosta, esim.
Ctl282a Kielten verkkopedagogiikka (2-4 ov)
Ks. KIT-verkoston www-sivut.
Ctl282 Muu kielenoppimisen teknologian erikoiskurssi
  • Monikielisen viestinnän teknologia, esim.
Ctl310mt Koneknns (2-4 ov) 49030030-3
Perehdyttää koneellisen ja koneavusteisen kääntämisen teoreettisiin malleihin ja käytännön ratkaisuihin. Vastuuhenkilö: prof. Carlson.
Ctl283 Muu monikielisen viestinn teknologian erikoiskurssi
  • Harjoittelu
Ctl285 Harjoittelu (2 ov) 490285-8
Tavoitteena opetus- tai työkokemuksen hankkiminen. Voi suorittaa toimimalla luennoitsijan ohjaamana kurssiassistenttina tai muussa ohjatussa opetustehtävässä tai esim. virastoharjoittelussa, mistä tekee raportin. Vastuuhenkilö: prof. Koskenniemi.
  • Muut erikoisalat, esim. kursseja KIT-verkostosta, ks. verkoston www-sivut.
Ctl289 Muun erikoisalan kurssi

Ctl300 Syventävät opinnot

(55-80 ov, tav. 60 ov) 490300-6

Syventävät opinnot edellyttävät vähintään hyvin tiedoin suoritettuja aineopintoja Ctl200 (35-60 ov) ja koostuvat niiden lisäksi kohdasta (9) sekä valinnaisista kursseista kohdasta (10), erityisesti KIT-verkoston kautta suoritettavista kursseista, joista ilmoitetaan erikseen. Arvosanaan tulee sisältyä vähintään 20 ov syventäviä opintoja.

(9) Kieliteknologian tutkimus 4 ov

Ctl330 Seminaari (2 ov) 490380-2
Laajempien harjoitustöiden ja pro gradu -tutkielman tekijöille, jossa voidaan raportoida suunnitelmia ja työn eri vaiheiden tuloksia ja ongelmia. Vastuuhenkilö: prof. Koskenniemi.
Ctl332 Kieliteknologian historia (2 ov) 490332-3
Ks. KIT-verkoston www-sivut. Vastuuhenkilö: prof. Koskenniemi.

(10) Valinnaisia opintoja kieliteknologiasta tai erikoisaloilta vähintään 16 ov. Erikoisaloista voi suorittaa kirjallisuutta erillisen luettelon tai sopimuksen mukaan tenttimällä tai essein. Esim.

  • Kieliteknologian menetelmät
Ctl310fs relliset automaatit (2-5 ov) 49030024-2
Kirjallisuutta esim. E. Roche, Y. Schabes (toim.) Finite-state Language Processing, B. Watson, Taxonomies and toolkits of regular language algorithms; artikkeleita. Vastuuhenkilö: prof. Koskenniemi.
Ctl351 Jsentmisen teknologia (2-5 ov) 490351-4
Edellyttää kieliteknologian jäsennysmenetelmien hallintaa, esim. Ctl253 ja erityisen vahvoja tietojenkäsittelytieteen pohjatietoja, esim. tietojenkäsittelytieteen sivuaineopinnot. Kirjallisuutta: osia mm. kirjoissa J. Hopcroft, J. Ullman Introduction to Automata Theory, Languages, and Computation; A. Aho, R. Sethi, J. Ullman, Compilers: Principles, Techniques, and Tools, D. Jurafsky, J. Martin, Speech and Language Processing, M. Tomita, Generalized LR Parsing, J. Levine, T. Mason, D., Br/own, lex and yacc. Vastuuhenkilö: prof. Koskenniemi.
Ctl362 Syntaksin ja semantiikan laskennalliset mallit (2-3 ov)
Unifikaatiopohjaiset syntaksin ja semantiikan mallit, looginen semantiikka, diskurssirepresentaa-tioteoria. Vastuuhenkilö: prof. Carlson.
Ctl310gen Luonnollisen kielen generointi (2-3 ov) 49030028-0
Kirja: E. Reiter, R. Dale Building Natural Language Generation Systems. Vastuuhenkilö: leht. Wilcock.
Ctl310dia Dialogin mallinnus (2-3 ov) 49030027-3
Dialogin mallinnuksen teoriaa ja käytännön sovelluksia. Kirjallisuutta: D. Gibbon, I. Mertins and R.K. Moore (eds) Handbook of Multimodal and Spoken Dialogue Systems. Resources, Terminology and Product Evaluation. Vastuuhenkilö: prof. Carlson.
Ctl310ml Koneoppiminen (2-3 ov)
Induktiivinen oppiminen, luokittelijoiden oppiminen, sovelluksia. T. Mitchell Machine Learning. Vastuuhenkilö: prof. Koskenniemi.
Ctl310xml Rakenteisten dokumenttien jatkokurssi (3 ov)
Rakenteisten (XML) dokumenttien etsinnän, muotoilemisen ja muuntamisen mallit ja kielet. Esitiedot: XML-metakieli, perustiedot kieliopeista ja automaateista, HTML, kohtuullinen ohjelmointitaito. Vastuuhenkilö: prof. Koskenniemi.
Ctl310 Muu erikoiskurssi
  • Kieliteknologian ammatilliset taidot
Ctl310com Kaupallinen kieliteknologia (1-2 ov) 49030023-5
Kieliteknologian ja kielitieteellisen teorian kaupallistamiseen ja tuotteistamiseen liittyviä erityiskysymyksiä sekä yleiskuva kieliteknologiaan pohjautuvasta liiketoiminnasta Suomessa, Pohjoismaissa ja muualla maailmassa. Vastuuhenkilö: prof. Koskenniemi.
Ctl310ipr Tekijnoikeudet (1-2 ov) 49030029-7
Vastuuhenkilö: prof. Koskenniemi.
Ctl310pro Projektityskentely (2 ov) 49030031-0
Projektin suunnittelun, seurannan ja ohjauksen keskeiset mallit ja menetelmät. Pienryhmässä suoritettava projektisuunnitelma. Vastuuhenkilö: prof. Koskenniemi.
Ctl335 Tykokemus (1-2 ov) 490335-2
Voi hankkia pitämällä kurssin esim. oman pro gradu -työn aiheesta tai työkokemuksella alan yrityksessä, josta todistus ja lyhyt raportti. Vastuuhenkilö: prof. Koskenniemi.
  • Puheteknologia, kursseja fonetiikasta tai KIT-verkostosta, esim.
Ctl381a Puheentunnistuksen jatkokurssi (2-4 ov)
Ks. KIT-verkoston www-sivut.
Vfo350 Puhesynteesin jatkokurssi (2-4 ov)
Ks. fonetiikka
Ctl381 Muu puheteknologian erikoiskurssi
  • Tietokoneavusteinen kielen oppiminen (CALL), kursseja KIT-verkostosta, esim.
Ctl382a Tietokoneavusteinen kielen oppiminen (CALL), (2-3 ov)
Ks. KIT-verkoston www-sivut. Vastuuhenkilö: prof. Koskenniemi.
Ctl382 Muu tietokoneavusteisen kielen oppimisen erikoiskurssi
  • Tiedonhaku ja tiedon eristäminen, kursseja myös KIT-verkostosta.
Ctl391 Tiedonhaku ja tiedon eristminen (2-4 ov)
Tiedonhaun ja tiedon eristämisen perusteet kieliteknologeille: algoritmit, sovellukset, käyttäjä-aspektit. Vastuuhenkilö: prof. Koskenniemi.
Ctl384 Muu tiedonhaun ja tiedon eristmisen erikoiskurssi
  • Muut erikoisalat, kursseja KIT-verkostosta, ks. verkoston www-sivut.
Ctl389 Muun erikoisalan kurssi

Ctl800 Pro gradu-tutkielma

(20 ov) 490800-1

Pro gradu -tutkielman tulee osoittaa pääaineopiskelijan kykyä ymmärtää ja soveltaa kieliteknologisia menetelmiä. Tutkielman pituus on tavallisesti 40-70 sivua. Tutkielman suunnitelma aikatauluineen tulee hyväksyttää ohjaajalla, jotta työn edistyminen voidaan varmistaa. Kieliteknologiassa on pyrkimys siihen, että huomattava osa tutkielmista voitaisiin tehdä palkallisina yrityksissä tai tutkimushankkeissa.

Sivun alkuun

Hae laitoksen sivuilta:

Laitoksen etusivulle | Tiedekunnan etusivulle | Yliopiston etusivulle

Copyright © 2003-2005 Helsingin yliopisto. Kaikki oikeudet pidätetään.