Yliopiston etusivulle In English
Helsingin yliopisto
Nykykielten laitos: Kieliteknologian oppiaine

Yhteystiedot

Nykykielten laitos

PL 24 (Unioninkatu 40)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 28313

Kieliteknologian tutkintovaatimukset 2005-2007

Mitä kieliteknologia on?

Kieliteknologia on toinen yleisen kielitieteen laitoksen oppiaineista. Aineen puitteissa hankitaan monitieteiset perustiedot alasta ja sen menetelmistä ja erikoistutaan jollekin kieliteknologian monista sovellusalueista.

Kieliteknologia tutkii, kehittää ja soveltaa menetelmiä luonnollisen kielen käsittelyä varten. Ihmiset viestivät ja varastoivat tietoa, kokemusta ja ymmärrystä tavallisesti kielen avulla, siis puheena tai tekstinä. Pidämme ensi näkemältä kieltä yksinkertaisena ja itsestään selvänä. Todellisuus osoittautuu kuitenkin toisenlaiseksi: vaikka kielessä on säännönmukaisuuksia, se on samalla myös hyvin moniselitteistä. Tämä paljastuu koko laajuudessaan, kun kieliteknologiassa yritämme opettaa tai ohjelmoida kielen tunnistamista tai tuottamista tietokoneelle. Luonnollisten kielten (kuten suomen tai englannin) kuvaaminen jäsentämistä ja tunnistamista varten vaatii kohteena olevan kielen ja sen rakenteen hyvää hallintaa. Kieliteknologia sisältää myös laskennan kannalta hyvin haasteellisia tehtäviä. Kieliteknologia onkin mielekäs ala ja innostava yhteistyökenttä kielestä kiinnostuneille sekä humanistisesti että teknisesti suuntautuneille opiskelijoille.

Sovellusten lisäksi voidaan erikoistua myös kieliteknologian menetelmiin, niiden kehittämiseen ja tutkimukseen. Kieliteknologiassa on meneillään useita tutkimus- ja sovellushankkeita osana laaja-alaista valtakunnallista tutkimusohjelmaa. Tutkimushankkeisiin saattaa päästä mukaan jo aineopintovaiheessa.

Kaikille avoin opetus

Kieliteknologia antaa myös kielitieteessä tarvittavan tietotekniikan opetusta tiedekunnan kaikkien aineiden opiskelijoille. Tällaisia opintoja ovat Kieliteknologian ATK-ympäristö Clt130, Korpusten käsittely Clt140 ja Rakenteisten dokumenttien perusteet Clt150. Kaikille yliopiston opiskelijoille avoimia kursseja ovat lisäksi ammattiin orientoitumisen kurssit mm. Projektinhallinta Clt310pro, Tekijänoikeudet Clt310ipr sekä Teknologian kaupallistaminen Clt310com.

Kieliteknologian opiskelijan sivuaineopinnoista

Pääaineopiskelijan tutkinnossa edellytetään tietojenkäsittelytieteen sivuaineopintoja vähintään perusopintojen 25 op laajuisina. Tietojenkäsittelytieteen kursseja voidaan sopimuksen mukaan sisällyttää myös kieliteknologian arvosanoihin. Opiskelija, joka haluaa erikoistua sekä yleiseen kielitieteeseen että kieliteknologiaan, voi ottaa yleisen kielitieteen sivuaineeksi kieliteknologian ja päinvastoin, kunhan samansisältöisiä kursseja ei sisällytetä opintokokonaisuuksiin. Vaihtoehtoisesti voi yleisen kielitieteen kursseja sisällyttää melko runsaasti kieliteknologian opintoihin. Kieliteknologian opintokokonaisuuksiin soveltuvia kursseja voi valita myös useiden laitosten ja korkeakoulujen yhteistyönä perustetun kieliteknologian opetuksen verkoston (KIT-verkoston) opetustarjonnasta, josta saa parhaiten tietoa kotisivulta http://www.ling.helsinki.fi/kit/. Pääaineopiskelija voi sisällyttää tutkintoonsa KIT-kursseista muodostuvan perus- tai aineopintojen laajuisen sivuaineen. KIT-verkoston kurssien sijoittamisestä kieliteknologian opintokokonaisuuteen on syytä sopia etukäteen. Myös sivuaineopiskelija voi suorittaa opintoja KIT-verkoston puitteissa sisällytettäväksi kieliteknologian opintokokonaisuuteen.

Opintojen rakenne

Kieliteknologian pääaineopinnot muodostuvat oppiaineen perus-, aine- ja syventävistä opinnoista sekä pro gradu -tutkielmasta. Perusopinnot ovat 25 opintopisteen, aineopinnot 45 opintopisteen ja syventävät opinnot (40 op) sekä pro gradu (40 op) yhteensä 80 opintopisteen laajuiset. Sivuaineena kieliteknologian aineopinnot suoritetaan 35 opintopisteen laajuisina.

Tässä kuvattujen varsinaisten perus- aine- ja syventävien opintojen laajuus ja suoritusten vaatimukset kuvataan yksityiskohtaisemmin alempana. Yksilöllinen sopiminen opintokokonaisuuksien muodostamisessa on mahdollista perus- ja aineopinnoissa mutta tarpeen erityisesti syventävissä opinnoissa. Usein kohdan voi suorittaa kirjatentillä tai muuten itseopiskeluna. Suoritusmahdollisuuksista, yhdistelmistä sekä korvaavuuskysymyksistä on syytä sopia etukäteen opintokokonaisuuden koostamisesta vastaavan professorin kanssa. KIT-verkoston kurssitarjonnan lisääntyessä voi sellaisiakin opintokohteita suorittaa myös KIT-verkostossa, joiden kohdalla tätä mahdollisuutta ei ole erikseen kuvauksessa mainittu. KIT-verkoston tarjonnasta ilmoitetaan erikseen.

Clt100 Perusopinnot

(1) Kielitiedettä kieliteknologiaa varten, (2) Teknisiä taitoja kieliteknologiaa varten, (3) Johdanto kieliteknologiaan, (4) Valinnaiset opinnot

Clt200 Aineopinnot

(5) Kieliteknologian ammattitaitoja, (6) Kieliohjelmat ja kieliresurssit, (7) Kieliteknologian menetelmät, (8) Tutkijan taidot (pääaineopiskelijalle), (9) Ammattiin orientointi (pääaineopiskelijalle), (10) Valinnaiset opinnot

Clt300 Syventävät opinnot

(11) Kieliteknologian teoriat ja menetelmät, (12) Ammatillisuus ja tutkijan taidot, (13) Valinnaiset opinnot, ja (14) Pro gradu -tutkielma

Opinto-ohjaus

Opintonsa aloittavalle pääaineopiskelijalle nimetään opettajatuutori, jonka kanssa keskustellaan opinnoista kaikissa opiskelun vaiheissa säännöllisesti. Viimeistään aineopintovaiheessa tehdään henkilökohtainen opintosuunnitelma yhdessä opettajatuutorin kanssa, mutta suunnitelman tekeminen kannattaa aloittaa jo opintojen alkuvaiheessa.

Vuokaavio (pdf) perus- ja aineopintojen kurssien suoritusjärjestyksestä ja riippuvuuksista.

Clt100 Perusopinnot 25 op

Vastuuopettaja: Kimmo Koskenniemi

Kieliteknologian perusopinnoissa hankitaan perustiedot luonnollisen kielen rakenteesta, saadaan johdatus kieliteknologian sovellusaloihin, menetelmiin, ongelmiin ja saavutuksiin, hankitaan tekstin ja puheen koneellisen käsittelyn alkeistaidot ja tutustutaan johonkin valinnaiseen kieliteknologian erikoisalaan.

Pakolliset osiot, pääaineopiskelijalle 22 op, sivuaineopiskelijalle 21 op.

(1) Kielitiedettä kieliteknologiaa varten pääaineopiskelijalle 10 op. Sivuaineopiskelijalle 7-10 op, jolloin toisen harjoituskursseista voi korvata vapaavalintaisella osiolla.

Yleisen kielitieteen perusteet: Clt110 (2 op)
Esitietovaatimukset: Ei esitietovaatimuksia
Sisältö: Ks. yleisen kielitieteen tutkintovaatimuskohta Cyk110.
Korvaavat suoritustavat: Voidaan suorittaa esim. opintojaksolla Cyk110 ks. yleinen kielitiede.
Fonetiikan perusteet: Clt120 (2 op)
Esitietovaatimukset: Ei esitietovaatimuksia
Sisältö: Fonetiikka tieteenalana, äänteiden kuvaamisen perusteet akustisesti sekä artikulatorisesti, keskittyen kuitenkin artikulatoriseen kuvaukseen. Kuvauksia käytetään pohjana foneettisille aakkosille, joiden avulla eri kielten äänteet voidaan luokitella systemaattisesti. IPA-aakkoston periaatteet.
Vastuuopettaja: Puheteknologian yliopistonlehtori
Fonologian ja morfologian harjoitukset: Clt111 (3 op)
Esitietovaatimukset: Yleisen kielitieteen perusteet, ks.Clt110
Sisältö: Ks. yleisen kielitieteen tutkintovaatimusten kohta Cyk130.
Korvaavat suoritustavat: Voidaan suorittaa esim. Fonologian ja morfologian harjoituskurssilla Cyk130 ks. yleinen kielitiede
Syntaksin harjoitukset: Clt125 (3 op)
Esitietovaatimukset: Yleisen kielitieteen perusteet, ks. Clt110
Sisältö: Ks. yleisen kielitieteen tutkintovaatimusten kohta Cyk140.
Korvaavat suoritustavat: Voidaan suorittaa esim. opintojaksolla Cyk140 ks. yleinen kielitiede

(2) Teknisiä taitoja kieliteknologiaa varten Pääaineopiskelijalle 6 op, sivuaineopiskelijalle 8 op

Pääaineopiskelijalle pakolliset osiot ovat Clt131 ja Clt132. Kieliteknologian ja yleisen kielitieteen pääaineopiskelijoille kohta Clt130 on pakollinen ja se kirjataan osaksi humanistisen tiedekunnan TVT-opintokokonaisuutta (eikä lasketa osaksi heidän perusopintojensa kokonaisuutta).

Kieliteknologian ATK-ympäristö: Clt130 (2 op)
Esitietovaatimukset: On hyödyllistä, jos on aiempaa kokemusta tietokoneiden käytöstä, mutta tämä ei ole mitenkään välttämätöntä.
Sisältö: Tavoitteena on tutustua yleisen kielitieteen laitoksen ATK-ympäristön erityispiirteisiin ja oppia hyödyntämään niitä sekä laitoksen tiloissa että tietoverkkojen läpi. Opitaan Unix-järjestelmän ja -ohjelmien peruskäyttötaidot: kirjoittautuminen, istunnon päättäminen, verkkoselain, sähköposti, tiedostojärjestelmä, tekstin muokkaus Emacs-editorin avulla, käyttö työasemalla ja palvelimen etäkäyttö, tiedostojen suojaukset.
Vastuuopettaja: Kieliteknologian yliopistonlehtori
Korpusten käsittely: Clt131 (3 op)
Esitietovaatimukset: Kieliteknologian ATK-ympäristön tuntemus, esim. Clt130.
Sisältö: Opitaan laatimaan tietokonemuotoisia tekstiaineistoja sekä muokkaamaan niitä. Lisää Emacs-editorin käytöstä. Poimitaan ja muokataan rivejä Unixin komentojen avulla. Opitaan yhdistämään yksinkertaisia komentoja komentosarjoiksi. Säännöllisten lausekkeiden käsite ja peruskäyttö. Valmiin, tiedostossa olevan puhesignaalin visualisointi. Tekstin yksinkertainen normalisointi, sananmuotojen frekvenssit, konkordanssi. Näytteitä erilaisista kieliaineistoista ja morfologisten ja syntaktisten jäsentimien tuotoksista, esimerkkejä morfologisista ja syntaktisista annotoinneista.
Vastuuopettaja: Kieliteknologian yliopistonlehtori
Rakenteisten dokumenttien perusteet: Clt132 (3 op)
Esitietovaatimukset: Kieliteknologian ATK-ympäristön tuntemus, esim. Clt130
Sisältö: Rakenteisten ja rakenteettomien (näköis- eli WYSIWYG-dokumenttien) dokumenttien väliset erot. Rakenteen merkkaus XML:n mukaisesti: alkiot ja attribuutit. Sopimukset tietyn rakenteen noudattamisesta (DTD), hyvinmuodostetut ja validoidut dokumentit. XHTML- ja HTML-kielten alkeet ja niiden erot. Rakenteisen dokumentin ulkonäön säätely ja CSS-muotoilukielen alkeita. Opitaan tunnistamaan XML-muotoisen tiedon rakenne, editoimaan XML-muotoista dokumenttia sekä laatimaan XHTML-dokumentti.
Kirjallisuus: Verkkomateriaalia, mm. http://www.w3.org
Vastuuopettaja: Kieliteknologian yliopistonlehtori

(3) Johdanto kieliteknologiaan 6 op pää-ja sivuaineopiskelijalle, 4 op TKK:n kieliteknologian opiskelijalle sekä 3 op yleisen kielitieteen opiskelijalle

Kieliteknologian johdanto ja harjoitukset: Clt140 (3-6 op)
Esitietovaatimukset: Kieliteknologian ATK-ympäristö, esim. Clt130, (tai muuten hankittu taito käyttää verkkoselainta ja sähköpostia), Yleisen kielitieteen perusteet, esim. Clt110, tai vastaavat tiedot
Sisältö: Johdatusta ymmärtämään kielen olemus kieliteknologian kannalta eli kielen automaattisen tunistamisen ja tuottamisen vaativuus. Kieliteknologian merkitys ja sen mahdollisuuksien tunnistaminen niin tämän päivän kuin tulevaisuudenkin sovelluksissa. Kirjoittajan apuvälineiden, vuorovaikutteisten sovellusten, tiedonhaun, kielen oppimisen ja kielen kääntämisen tärkeimmät kieliteknologiset apuvälineet.
Kirjallisuus: Verkkomateriaalia, mm. kurssimoniste ja oheislukemistona osia teoksista (1) Ruslan Mitkov (ed.), The Oxford Handbook of Computational Linguistcs, Oxford University Press, 2003, (2) Daniel Jurafsky and James H. Martin, Speech and Language Processing, Prentice Hall, NJ, 2000.
Vastuuopettaja: Kimmo Koskenniemi

(4) Valinnaiset osiot

Sikäli, kun kielitieteen tai teknisten taitojen osioista on muihin kokonaisuuksiin sisällytetty vastaavia osia, niitä ei suoriteta kieliteknologiassa uudestaan, vaan tilalle voi valita vapaavalintaisia osioita, esim.:

Semantiikan ja pragmatiikan harjoitukset: Clt113 (3-5 op)
Sisältö: Ks. yleisen kielitieteen tutkinovaatimusten kohta Cyk150.
Korvaavat suoritustavat: Voidaan suorittaa esim. harjoituskurssilla Cyk150 ks. yleinen kielitiede
Fonetiikan harjoitukset: Clt121 (2-5 op)
Esitietovaatimukset: Fonetiikan perusteet esim. Clt120
Sisältö: Puhe tutkimuskohteena, puhesignaali ja sen segmentaaliset ja suprasegmentaaliset piirteet, puhesignaalin auditiivinen analyysi, foneettisen transkription perusteet, puheäänteiden akustiikkaa ja psykoakustiikkaa, prosodisten muuttujien vaikutus puheeseen.
Johdanto puheen akustiikkaan: Clt122 (3-5 op)
Esitietovaatimukset: Fonetiikan perusteet esim. Clt120
Sisältö: Tavoitteena on kokonaiskäsitys puheen tuottoon liittyvistä akustisista ilmiöistä, kuten ääniaallot, äänekkyys ja äänenkorkeus, äänenlaatu, resonanssi, ääniväylän resonanssit ja kuulon toimintaan sekä äänen analyysiin tutustuminen.
Vastuuopettaja: Puheteknologian yliopistonlehtori
Tietokoneavusteinen kääntäminen: Cmo241 (3-5 op)
Esitietovaatimukset: Käsitys kääntäjän työstä; tietotekniikan perustaidot.
Sisältö: Tavoitteena on selvittää miten kääntäjä voi käyttää tietoteknikkaa ja sähköistä viestintää työssään. Tutustutaan seuraaviin työkaluihin (sisältö vaihtelee vuosittain): Rakenteisten dokumenttien hallinta, tiedonhaku webistä, elektroniset sanalistat, sanakirjat ja tietosanakirjat, verkkosanakirjat, oikoluku- ja kielentarkistusohjelmat, termipankit, terminhallinta- ja sanastusohjelmat, käännösmuistit, konekäännös
Vastuuopettaja: Lauri Carlson

Clt200 Aineopinnot 45 op, sivuaineena 35 op

Vastuuopettaja: Kimmo Koskenniemi

Aineopinnoissa perehdytään käytännössä kieliteknologian menetelmiin ja resursseihin, syvennetään kieliteknologian teknisiä ja ammatillisia taitoja sekä harjoitellaan alan tutkijan valmiuksia.

(5) Kieliteknologian ammattitaitoja 9 op

Ohjelmoinnin perusteet: Clt230 (3 op)
Esitietovaatimukset: Unix-järjestelmän käytön sekä Emacs-editorin perustuntemus, esim. Clt130
Sisältö: Tekstin ja muun tiedon käsittely laatimalla lyhyitä ohjelmia, ohjelmissa olevien virheiden etsiminen ja korjaaminen, ohjelmoinnin perusasiat siekä niihin liittyvät käsitteet kuten toisto, ehdollisuus, aliohjelma ja parametri.
Vastuuopettaja: Kieliteknologian yliopistonlehtori
Rakenteisten dokumenttien käsittely: Clt232 (3 op)
Esitietovaatimukset: Rakenteisten dokumenttien perusteet, esim. Clt132
Sisältö: XML-standardi yksityiskohtaisemmin (yksiselitteiset tunnukset, linkitys, nimiavaruudet); XML-jäsennin ja validointi; DTD ja skeema(t); XSLT-muunnokset; LaTeX rakenteisena dokumenttina ja LaTeX-dokumenttien tekeminen;
Vastuuopettaja: Kieliteknologian yliopistonlehtori
Kielenkäsittelymoduulien evaluointi: Clt250 (3 op)
Esitietovaatimukset: Ohjelmoinnin perusteet, esim. Clt230 tai vastaavat tiedot ja taidot.
Sisältö: Johdatusta ymmärtämään evaluoinnin olemus kieliteknologiassa eli kielen automaattisen tunnistamisen ja tuottamisen onnistuneisuuden arviointi. Tilastollisen testaamisen perusteet; tavallisimpia tilastollisia testejä; tilastollinen merkitsevyys; kielenkäsittelymoduulien tuotos tilastollisena aineistona; kielenkäsittelymoduulin arvioiminen. Kurssilla opetellaan myös käyttämään tilastollista järjestelmää (esim. R:ää).
Kirjallisuus: Verkkomateriaalia ja oheislukemistona osia teoksista: (1) R. H. Baayen, Word Frequency Distributions, Kluwer Academic Publishers, Dordrecht, 2001. (2) http://cran.r-project.org/doc/manuals/R-intro.pdf 96 s.
Vastuuopettaja: Kieliteknologian yliopistonlehtori

(6) Kieliohjelmat ja kieliresurssit 6 op

Morfologiset kielenkäsittelyohjelmat: Clt260 (3 op)
Esitietovaatimukset: Yleisen kielitieteen perustiedot, esim. yleisen kielitieteen perusteet Ctl110, kieliteknologian perustiedot, esim. Clt140, sekä perustietoja morfologiasta, esim. Clt111.
Sisältö: Morfologian ilmiöt jäsennysongelmina, käytössä olevien jäsennysmenetelmien toimintaperiaatteet ja annotaatiot, kielen kuvaaminen ao. menetelmillä. Morfologisen jäsentimen syötteet ja tulosteet; Morfologian ja fonologian ymmärtämistä tällaisessa viitekehyksessä.
Kirjallisuus: Richard Sproat, Morphology and Computation (osia), verkkomateriaalia.
Vastuuopettaja: Kimmo Koskenniemi
Syntaktiset kielenkäsittelyohjelmat: Clt261 (3 op)
Esitietovaatimukset: Yleisen kielitieteen perustiedot, esim. Yleisen kielitieteen perusteet Clt110, Kieliteknologian johdantokurssi ja harjoitukset Clt140 (tai muuten hankitut kieliteknologian perustiedot), sekä perustietoja syntaksista, esim. Syntaksin harjoitukset Clt125
Sisältö: Syntaksin ilmiöt jäsennysongelmina, käytössä olevien jäsennysmenetelmien toimintaperiaatteet ja annotaatiot, kielen kuvaaminen ao. menetelmillä. Sanaluokkajäsennys (tagging), lausekkeiden tunnistus (chunking), pintajäsennys (surface parsing), syväjäsennys (deep parsing).
Vastuuopettaja: Kimmo Koskenniemi

(7) Kieliteknologian menetelmät 10 op

Äärellistilaiset jäsennysmenetelmät: Clt270 (3 op)
Esitietovaatimukset: Ohjelmoinnin perusteet esim. Clt230, Morfologiset kielenkäsittelyohjelmat esim. Clt260.
Sisältö: Pienimuotoisen morfologisen jäsentimen laatiminen äärellistilaisten transduktorien avulla esim. XFST:n avulla. Transduktorileksikko ja sen rakenne, fonologiset säännöt ja näiden yhteispeli.
Kirjallisuus: Kenneth R. Beesley and Lauri Karttunen, Finite State Morphology, CSLI Publications, 2003.
Vastuuopettaja: Kimmo Koskenniemi
Kontekstittomat jäsennysmenetelmät ja Prolog: Clt271 (4 op)
Esitietovaatimukset: Ohjelmoinnin perusteet, esim. Clt230, syntaktiset kielenkäsittelyohjelmat, esim. Clt261, tietoja syntaksin teorioista, esim. Clt125
Sisältö: Lausekekielioppipohjaisten kielioppien (context-free grammar) kirjoittaminen ja jäsentäminen, tarvittava Prolog-kielen taito. Osittava (top-down) ja kokoava (bottom-up) jäsennys, taulukkojäsennys, leksikko ja leksikaaliset säännöt, piirrerakenteet, HPSG-kielioppi (Head-driven Phrase Structure Grammar)
Vastuuopettaja: Kieliteknologian yliopistonlehtori
Puhesynteesin perusteet: Clt220 (3 op)
Esitietovaatimukset: Fonetiikan perusteet, esim. Clt120, Johdanto kieliteknologiaan, esim. Clt140, tai vastaavat tiedot.
Sisältö: Tavoitteena on antaa yleiskäsitys tekstistä puhetta muokkaavien järjestelmien toiminnasta ja niiden käyttämistä tekniikoista. Tutustutaan puhesynteesin historiaan, formanttisynteesiin, tekstin analyysiin, difonikonkatenaatioon ja unit selection -tekniikoihin sekä TTS (Text-to-Speech)-menetelmään.
Vastuuopettaja: Puheteknologian yliopistonlehtori

(8) Tutkijan taidot 10 op pääaineopiskelijoille

Proseminaari: Clt240 (4 op)
Esitietovaatimukset: Aineopintojen tärkeimät kurssit on hyvä olla suoritettuina.
Sisältö: Suullinen ja kirjallinen esitys. Proseminaarissa tehdään kieliteknologisesta aiheesta esitelmä, posteri tai verkkosivu. Kandidaatintutkielman suunnittelu ja suunnitelman esittely.
Vastuuopettaja: Kieliteknologian yliopistonlehtori
Kandidaatintutkielma: Clt241 (6 op)
Sisältö: Johonkin kieliteknologiseen aiheeseen liittyvä itsenäinen työ ja siitä tehty n. 15 sivun kirjallinen raportti. Tavoitteena on, että kirjallinen työ valmistuu proseminaarin aikana.
Vastuuopettaja: Kieliteknologian yliopistonlehtori

(9) Ammattiin orientointi 4 op pääaineopiskelijoille, sivuaineopiskeljat valitsevat tilalle vapaavalintaisen osion.

Henkilökohtainen opintosuunnitelma, HOPS: Clt280 (1 op)
Sisältö: HOPS suunnitellaan yhdessä opettajatuutorin kanssa aineopintojen alussa. HuK-tutkinnon rakenne, siihen kuuluvat opinnot sekä opintojen eteneminen. Tieteenalaan tutustuminen ja oman oppimisen arviointi.
Vastuuopettaja: Opettajatuutori
Työelämään orientoiva osio: Clt281 (3 op)
Sisältö: Suoritetaan esim. opintokohde Projektinhallinta Clt310pro samanaikaisesti henkilökohtaisen opintosuunnitelma työstämisen kanssa.

(10) Valinnaiset osiot 6 op pääaineopiskelijoille, 10 op sivuaineopiskelijoille

Sikäli kun aineopintojen osioista on muihin kokonaisuuksiin sisällytetty vastaavia osia, ei niitä suoriteta kieliteknologiassa uudestaan, vaan tilalle voi valita vapaavalintaisia osioita, esim.:

Harjoittelu: Clt282 (3 op)
Sisältö: Tavoitteena opetus- tai työkokemuksen hankkiminen. Voi suorittaa toimimalla luennoitsijan ohjaamana kurssiassistenttina tai muussa ohjatussa opetustehtävässä tai esim. valtionhallinnon harjoittelussa tai alan yrityksessaä, mistä tekee raportin.
Vastuuopettaja: Kimmo Koskenniemi
Avoimen koodin kieliteknologia: Clt262 (3-5 op)
Esitietovaatimukset: Java-ohjelmointikielen perusteet, XML ja XSLT
Sisältö: Vapaan koodin lisensseistä, mm. GPL. Avoimen lähdekoodin ohjelmien asentaminen: Xerces ja Xalan. Avoimen lähdekoodin ohjelmien käyttö: Java and XSLT, ohjelmien testaaminen, IDE-ohjelmat, tietokantaohjelmat, GATE, WordNet.
Vastuuopettaja: Kieliteknologian yliopistonlehtori
Puheaineistot: Clt222 (3-5 op)
Esitietovaatimukset: Fonetiikan perusteet (mielellään myös fonetiikan harjoitukset), esim. Ctl120 ja Clt121 sekä kieliteknologian perusteet, esim. Ctl140
Sisältö: Digitaalisten puheaineistojen ja puhetietokantojen käsittely erilai sten työkalujen avulla, puhekorpusten suunnittelu, tekeminen ja annotointi, puheen an notointi, puhekorpusten käyttö tutkimuksessa.
Vastuuopettaja: Puheteknologian yliopistonlehtori
Käytännön puheteknologiasovellukset: Clt221 (3-5 op)
Sisältö: Tutustutaan puheteknologisiin sovelluksiin ja teknologioihin. Voi suorittaa esim. KIT-verkostossa.
Muu kieliteknologian erikoiskurssi: Clt290 (3-5 op)
Sisältö: Yleisen kielitieteen, muiden yhteistyölaitosten tai KIT-verkoston opintoja sopimuksen mukaan.
Vastuuopettaja: Kimmo Koskenniemi

Syventävät opinnot 80 op

Vastuuopettaja: Kimmo Koskenniemi

Syventävissä opinnoissa täydennetään kieliteknologian teknisiä ja ammatillisia taitoja, perehdytään alan keskeisiin teorioihin ja malleihin ja hankitaan taito tehdä suunnitelmallista selvitys- ja tutkimustyötä.

(11) Kieliteknologian teoriat ja menetelmät 9 op

Äärellistilaisten jäsennysmenetelmien teoria: Clt370 (3 op)
Sisältö: Äärellistilaisten automaattien ja transduktorien kalkyyliä ja erilaisten jäsennysmenetelmien toteuttaminen tällaisilla menetelmillä.
Kirjallisuus: Emmanuel Roche and Yves Shabes (eds), Finite-State Language Processing. MIT Press, 1997.
Vastuuopettaja: Kimmo Koskenniemi
Syntaktisten jäsennysmenetelmien teoria: Clt371 (3 op)
Esitietovaatimukset: Perustiedot jäsentämisestä, esim. Syntaktiset kielenkäsittelyohjelmat Clt261, Kontekstittomat jäsennysmenetelmät esim. Clt271
Sisältö: Luonnollinen kieli ja formaalikielten teoria, kielioppimalleista (äärellistilaiset, lauseke-, dependenssi-, kategoria- ja piirrekieliopit), jäsennysmenetelmistä (deterministinen vs. nondeterministinen, kokoava vs. karsiva, tulkkaava vs. kääntävä), jäsennyksen vaiheistus, jäsennyssuunnat ja -järjestykset, jäsennyksen vaativuus, kieliopin ja leksikon työnjako, jäsennys vastaan generointi.
Vastuuopettaja: Kieliteknologian yliopistonlehtori
Tilastollispohjaiset jäsennysmenetelmät: Clt350 (3 op)
Esitietovaatimukset: Johdanto kieliteknologiaan, esim. Clt140, kielenkäsittelymoduulien evaluointi, esim. Clt250.
Sisältö: Johdatusta ymmärtämään kielen tilastollinen olemus kieliteknologian kannalta eli kielen automaattisen tunnistamisen ja tuottamisen tilastollinen vaativuus. Tilastollisen kieliteknologian merkitys ja sen mahdollisuuksien tunnistaminen niin tämän päivän kuin tulevaisuudenkin sovelluksissa. Kirjoittajan apuvälineiden, vuorovaikutteisten sovellusten, tiedonhaun, kielen oppimisen ja kielen kääntämisen tärkeimmät tilastopohjaiset kieliteknologiset apuvälineet.
Kirjallisuus: Verkkomateriaalia ja oheislukemistona osia teoksista: (1) Christopher D. Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, The MIT Press, 1999, (2) Daniel Jurafsky and James H. Martin, Speech and Language Processing, Prentice Hall, NJ, 2000.
Vastuuopettaja: Kimmo Koskenniemi

(12) Ammatillisuus ja tutkijan taidot 14 op, kieliteknologian ja puheteknologian seminaarit vaihtoehtoisia

Seminaari: Clt340 (10 op)
Sisältö: Laajempien harjoitustöiden ja pro gradu -tutkielman tekijöille, jossa voidaan raportoida suunnitelmia ja työn eri vaiheiden tuloksia ja ongelmia.
Vastuuopettaja: Kimmo Koskenniemi
Puheteknologian seminaari: Clt320 (10 op)
Sisältö: Laajempien harjoitustöiden ja pro gradu -tutkielman tekijöille, jossa voidaan raportoida suunnitelmia ja työn eri vaiheiden tuloksia ja ongelmia.
Vastuuopettaja: Puheteknologian yliopistonlehtori
Henkilökohtainen opintosuunnitelma ja työelämäorientaatio: Clt380 (4 op)
Sisältö: HOPS sisältää syventävien opintojen ja pro gradu-työn suunnittelua sekä vapaastivalittavien opintojen kartoitusta ja valintaa graduaiheen mukaan. Työelämäorientaatio-osion voi suorittaa esim. kursseilla Clt310ipr Tekijänoikeudet tai Clt310com Teknologian kaupallistaminen tai työkokemuksella kieliteknologian alan projektissa.
Vastuuopettaja: Opettajatuutori

(13) Valinnaiset opinnot 20 op

Kieliteknologian historia: Clt310hist (3-5 op)
Sisältö: Perehtyminen kieliteknologian aiempiin vaiheisiin ja merkkipaaluihin.
Kirjallisuus: Joukko verkkosivulla lueteltuja klassikkoartikkeleita ja -kirjoja, sovitaan etukäteen tenttijän kanssa.
Vastuuopettaja: Kimmo Koskenniemi
Äärellistilaiset automaatit : Clt310fs (3-5 op)
Sisältö: Äärellistilaisten automaattien ja transduktorien algebraa, yhdiste, leikkaus, kompositio, determinisointi, minimointi. Erilaisten asioden tekemistä olemassa olevien ohjelmien avulla.
Vastuuopettaja: Kimmo Koskenniemi
Semantic Web: Clt310semw (3-5 op)
Esitietovaatimukset: Java-ohjelmointi, XML, XML Schema, XHTML, relaatiotietokannat ja SQL, esim. Avoimen lähdekoodin kieliteknologia Clt262
Sisältö: W3C-konsortion Semantic Web-aloite koostuu keinoista tehostaa webissä olevan tiedon koneellista hakua ja käsittelyä rakenteisen metadatan avulla. Keskeisiä Semantic Web-tekniikoita ja kuvauskieliä ja niiden yhdistämistä kieliteknologiaan. Semantic Web: XML, metadata ja ontologiat, RDF (Resource Description Framework) ja RDF Schema RDF:n käsittely Javalla: Jena-työkalupakki, RDF:n talletus SQL-tietokannassa: Jenan RDQL-kyselykieli. Ontologiatyö: Protégé ontologiaeditori, ontologiakielet: RDFS, DAML+OIL, OWL, luonnollisen kielen ontologiat: WordNet, OntoWordNet, FrameNet.
Vastuuopettaja: Kimmo Koskenniemi
Koneoppiminen: Clt310ml (3-5 op)
Esitietovaatimukset: Kielenkäsittelymoduulien evaluointi, esim.Clt250, ohjelmoinnin perusteet, esim. Ctl230
Sisältö: Johdatusta ymmärtämään mitä koneoppiminen voi tarjota kieliteknologian kannalta eli kielen automaattisen tunnistamisen ja tuottamisen sovittaminen eri käyttötilanteisiin. Johdanto koneoppimiseen kieliteknologiassa: ohjattua oppimista (aineiston luokittelu esimerkkien perusteella), puoliohjattua oppimista (aineiston luokittelu siemenesimerkkien perusteella), puoliohjaamatonta oppimista (aineiston ryhmittely tai visualisointi viiteaineiston mukaan), ohjaamatonta oppimista (aineiston ryhmittely tai visualisointi suoraan). Koneoppimisen hyödyntäminen kirjoittajan apuvälineiden, vuorovaikutteisten sovellusten, tiedonhaun, kielen oppimisen ja kielen kääntämisen tärkeimmissä kieliteknologisissa apuvälineissä.
Kirjallisuus: Verkkomateriaalia ja oheislukemistona osia teoksista: (1) Ruslan Mitkov (ed.), The Oxford Handbook of Computational Linguistcs, Oxford University Press, 2003, (2) Daniel Jurafsky and James H. Martin, Speech and Language Processing, Prentice Hall, NJ, 2000. (3) Christopher D. Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, The MIT Press, 1999.
Vastuuopettaja: Kimmo Koskenniemi
Luonnollisen kielen generointi: Clt310gen (3-5 op)
Esitietovaatimukset: Java-ohjelmointi, XML, XML Schema ja XSLT esim. Clt230, Java, Ant, SQL, WordNet, esim. Clt262, yleisen kielitieen perustiedot: morfologia, syntaksi, semantiikka, esim. Clt110
Sisältö: Tutustuminen luonnollisen kielen tuottamiseen: ongelmat, tekniikat, tehtävät, arkkitehtuurit, tekstin ja dialogin generointi. Johdatus generointiin, generointiarkkitehtuurit, generointivaiheet, templaattipohjainen generointi, pinta-ja syvägenerointi, XML-pohjainen generointi, dialogin generointi.
Vastuuopettaja: Kimmo Koskenniemi
Dialogin mallinnus: Clt310dia (3-5 op)
Esitietovaatimukset: Kieliteknologian perusopinnot
Sisältö: Keskustelu vs. dialogi, keskustelujen litterointi, dialogin mallintaminen, tutustuminen dialogin mallinnusta kehittäviin projekteihin (esim. Interact).
Kirjallisuus: M.McTear: Spoken Dialogue Technology: Enabling the Conversational User Interface
Vastuuopettaja: Lauri Carlson
Tietokoneavusteinen kielen oppiminen : Clt310call (3-5 op)
Esitietovaatimukset: Yleisen kielitieteen perustiedot: morfologia, syntaksi, semantiikka, esim.Clt110 sekä perustiedot ohjelmoinnista, esim Clt230
Sisältö: Tutustuminen kielen opettamisen kieliteknologiaan: ongelmat, tekniikat, tehtävät, ratkaisut, CALL:in historia, CALL:iin soveltuvat kieliteknologiat, olemassaolevat CALL-ratkaisut, alan tutkimuksen nykytila ja mahdollisuudet
Vastuuopettaja: Kimmo Koskenniemi
Korpukset ja kieli: Clt310corp (3-5 op)
Esitietovaatimukset: Ei esitietovaatimuksia.
Sisältö: Kurssin tavoitteena on kokemusperäisesti tarkastella, miten korpuksia voidaan käyttää kielen tutkimuksessa, minkälaisia tutkimuskysymyksiä korpuksille kannattaa esittää, miten korpuksia kannattaa tutkia sekä mitä tulosten pohjalta voidaan sanoa kielestä.
Vastuuopettaja: Kimmo Koskenniemi
Teknologian kaupallistaminen: Clt310com (3-5 op)
Esitietovaatimukset: Ei esitietovaatimuksia
Sisältö: Tavoitteena on tarkastella kieliteknologisen ja kielitieteellisen teorian kaupallistamiseen ja tuotteistamiseen liittyviä erityiskysymyksiä ja antaa yleiskuva kieliteknologiaan pohjautuvasta liiketoiminnasta Suomessa, Pohjoismaissa ja muualla maailmassa. Kaupallinen kieliteknologia käytännössä, Suomessa ja muissa Pohjoismaissa, kieliteknologiset tuotekehitysprojektit, kaupallisen kieliteknologian tulevaisuus: mahdollisuudet ja karikot.
Kirjallisuus: Naumanen, Mika 2002. Nuorten teknologiayritysten menestystekijät. SITRAn raportteja sarja, ISSN 1457-5728; 28. Edita Publishing Oy, Helsinki.
Vastuuopettaja: Kimmo Koskenniemi
Projektinhallinta: Clt310pro (3-5 op)
Esitietovaatimukset: Ei esitietovaatimuksia, mutta luentomateriaaliin etukäteen tutustumista suositellaan.
Sisältö: Kurssin tavoitteena on antaa yleiskuva siitä, mitä projektit ovat, minkälaista on työskennellä projekteissa, ja miten projekteja suunnitellaan, seurataan ja johdetaan. Kurssilla näkökulmana on kieliteknologin työuralle tyypillinen projektitoiminta.
Vastuuopettaja: Kimmo Koskenniemi
Tekijänoikeudet: Clt310ipr (3-5 op)
Esitietovaatimukset: Ei varsinaisia esitietovaatimuksia. Tarkoitettu syventäviä opintoja suorittaville, joten opiskelijoilla oletetaan olevan perustiedot yleisimmistä kieliteknologisista sovelluksista ja aiheen kannalta relevanteista lingvistisistä menetelmistä.
Sisältö: Tavoitteena on perehdyttää opiskelija immateriaalioikeuden järjestelmään ja keskeisiin käsitteisiin yleisellä tasolla sekä antaa valmiuksia soveltamaan immateriaalioikeutta kieliteknologin tai lingvistin tyypillisesti kohtaamissa käytännön tilanteissa. Tekijänoikeus ja lähioikeudet, teollisoikeudet, immateriaalioikeudet ja korpukset, internet, kieliteknologiatuotteet ja tutkimus.
Vastuuopettaja: Kimmo Koskenniemi
Muu kieliteknologian erikoiskurssi: Clt310 (3-5 op)
Sisältö: Yleisen kielitieteen, muiden yhteistyölaitosten tai KIT-verkoston opintoja sopimuksen mukaan.
Vastuuopettaja: Kimmo Koskenniemi

(14) Pro gradu -tutkielma 40 op

Pro Gradu-tutkielma: Clt800 (40 op)
Sisältö: Pro gradu -tutkielman tulee osoittaa pääaineopiskelijan kykyä ymmärtää ja soveltaa kieliteknologisia menetelmiä. Tutkielman pituus on tavallisesti 40-70 sivua. Tutkielman suunnitelma aikatauluineen tulee hyväksyttää ohjaajalla, jotta työn edistyminen voidaan varmistaa. Kieliteknologiassa on pyrkimys siihen, että huomattava osa tutkielmista voitaisiin tehdä palkallisina yrityksissä tai tutkimushankkeissa.
Vastuuopettaja: Kimmo Koskenniemi

Hae laitoksen sivuilta:

Laitoksen etusivulle | Tiedekunnan etusivulle | Yliopiston etusivulle

Copyright © 2003-2005 Helsingin yliopisto. Kaikki oikeudet pidätetään.