Yhteystiedot
Nykykielten laitos
PL 24 (Unioninkatu 40)
00014 HELSINGIN YLIOPISTO
Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 28313
|
|
tulostettava versio
Kieliteknologian tutkintovaatimukset 2005-2007
Mitä kieliteknologia on?
Kieliteknologia on toinen yleisen kielitieteen laitoksen
oppiaineista. Aineen puitteissa hankitaan monitieteiset perustiedot
alasta ja sen menetelmistä ja erikoistutaan jollekin
kieliteknologian monista sovellusalueista.
Kieliteknologia tutkii, kehittää ja soveltaa menetelmiä
luonnollisen kielen käsittelyä varten. Ihmiset viestivät ja
varastoivat tietoa, kokemusta ja ymmärrystä tavallisesti kielen
avulla, siis puheena tai tekstinä. Pidämme ensi näkemältä kieltä
yksinkertaisena ja itsestään selvänä. Todellisuus osoittautuu
kuitenkin toisenlaiseksi: vaikka kielessä on säännönmukaisuuksia, se
on samalla myös hyvin moniselitteistä. Tämä paljastuu koko
laajuudessaan, kun kieliteknologiassa yritämme opettaa tai
ohjelmoida kielen tunnistamista tai tuottamista
tietokoneelle. Luonnollisten kielten (kuten suomen tai englannin)
kuvaaminen jäsentämistä ja tunnistamista varten vaatii kohteena
olevan kielen ja sen rakenteen hyvää hallintaa. Kieliteknologia
sisältää myös laskennan kannalta hyvin haasteellisia
tehtäviä. Kieliteknologia onkin mielekäs ala ja innostava
yhteistyökenttä kielestä kiinnostuneille sekä humanistisesti että
teknisesti suuntautuneille opiskelijoille.
Sovellusten lisäksi voidaan erikoistua myös kieliteknologian
menetelmiin, niiden kehittämiseen ja
tutkimukseen. Kieliteknologiassa on meneillään useita tutkimus- ja
sovellushankkeita osana laaja-alaista valtakunnallista
tutkimusohjelmaa. Tutkimushankkeisiin saattaa päästä mukaan jo
aineopintovaiheessa.
Kaikille avoin opetus
Kieliteknologia antaa myös kielitieteessä tarvittavan
tietotekniikan opetusta tiedekunnan kaikkien aineiden
opiskelijoille. Tällaisia opintoja ovat Kieliteknologian
ATK-ympäristö Clt130, Korpusten käsittely Clt140 ja Rakenteisten
dokumenttien perusteet Clt150. Kaikille yliopiston opiskelijoille
avoimia kursseja ovat lisäksi ammattiin orientoitumisen kurssit mm.
Projektinhallinta Clt310pro, Tekijänoikeudet Clt310ipr sekä
Teknologian kaupallistaminen Clt310com.
Kieliteknologian opiskelijan sivuaineopinnoista
Pääaineopiskelijan tutkinnossa edellytetään
tietojenkäsittelytieteen sivuaineopintoja vähintään perusopintojen
25 op laajuisina. Tietojenkäsittelytieteen kursseja voidaan
sopimuksen mukaan sisällyttää myös kieliteknologian
arvosanoihin. Opiskelija, joka haluaa erikoistua sekä yleiseen
kielitieteeseen että kieliteknologiaan, voi ottaa yleisen
kielitieteen sivuaineeksi kieliteknologian ja päinvastoin, kunhan
samansisältöisiä kursseja ei sisällytetä opintokokonaisuuksiin.
Vaihtoehtoisesti voi yleisen kielitieteen kursseja sisällyttää
melko runsaasti kieliteknologian opintoihin. Kieliteknologian
opintokokonaisuuksiin soveltuvia kursseja voi valita myös useiden
laitosten ja korkeakoulujen yhteistyönä perustetun
kieliteknologian opetuksen verkoston (KIT-verkoston)
opetustarjonnasta, josta saa parhaiten tietoa kotisivulta http://www.ling.helsinki.fi/kit/. Pääaineopiskelija voi
sisällyttää tutkintoonsa KIT-kursseista muodostuvan perus- tai
aineopintojen laajuisen sivuaineen. KIT-verkoston kurssien
sijoittamisestä kieliteknologian opintokokonaisuuteen on syytä
sopia etukäteen. Myös sivuaineopiskelija voi suorittaa opintoja
KIT-verkoston puitteissa sisällytettäväksi kieliteknologian
opintokokonaisuuteen.
Opintojen rakenne
Kieliteknologian pääaineopinnot muodostuvat oppiaineen perus-,
aine- ja syventävistä opinnoista sekä pro gradu -tutkielmasta.
Perusopinnot ovat 25 opintopisteen, aineopinnot 45 opintopisteen
ja syventävät opinnot (40 op) sekä pro gradu (40 op) yhteensä 80
opintopisteen laajuiset. Sivuaineena kieliteknologian aineopinnot
suoritetaan 35 opintopisteen laajuisina.
Tässä kuvattujen varsinaisten perus- aine- ja syventävien
opintojen laajuus ja suoritusten vaatimukset kuvataan
yksityiskohtaisemmin alempana. Yksilöllinen sopiminen
opintokokonaisuuksien muodostamisessa on mahdollista perus- ja
aineopinnoissa mutta tarpeen erityisesti syventävissä
opinnoissa. Usein kohdan voi suorittaa kirjatentillä tai muuten
itseopiskeluna. Suoritusmahdollisuuksista, yhdistelmistä sekä
korvaavuuskysymyksistä on syytä sopia etukäteen opintokokonaisuuden
koostamisesta vastaavan professorin kanssa. KIT-verkoston
kurssitarjonnan lisääntyessä voi sellaisiakin opintokohteita
suorittaa myös KIT-verkostossa, joiden kohdalla tätä mahdollisuutta
ei ole erikseen kuvauksessa mainittu. KIT-verkoston tarjonnasta
ilmoitetaan erikseen.
Clt100 Perusopinnot
(1) Kielitiedettä kieliteknologiaa varten,
(2) Teknisiä taitoja kieliteknologiaa varten,
(3) Johdanto kieliteknologiaan,
(4) Valinnaiset opinnot
Clt200 Aineopinnot
(5) Kieliteknologian ammattitaitoja,
(6) Kieliohjelmat ja kieliresurssit,
(7) Kieliteknologian menetelmät,
(8) Tutkijan taidot (pääaineopiskelijalle),
(9) Ammattiin orientointi (pääaineopiskelijalle),
(10) Valinnaiset opinnot
Clt300 Syventävät opinnot
(11) Kieliteknologian teoriat ja menetelmät,
(12) Ammatillisuus ja tutkijan taidot,
(13) Valinnaiset opinnot, ja (14) Pro gradu -tutkielma
Opinto-ohjaus
Opintonsa aloittavalle pääaineopiskelijalle nimetään
opettajatuutori, jonka kanssa keskustellaan opinnoista kaikissa
opiskelun vaiheissa säännöllisesti. Viimeistään
aineopintovaiheessa tehdään henkilökohtainen opintosuunnitelma
yhdessä opettajatuutorin kanssa, mutta suunnitelman tekeminen
kannattaa aloittaa jo opintojen alkuvaiheessa.
Vuokaavio (pdf) perus- ja aineopintojen kurssien
suoritusjärjestyksestä ja riippuvuuksista.
Clt100 Perusopinnot 25 op
Vastuuopettaja: Kimmo Koskenniemi
Kieliteknologian perusopinnoissa hankitaan perustiedot
luonnollisen kielen rakenteesta, saadaan johdatus kieliteknologian
sovellusaloihin, menetelmiin, ongelmiin ja saavutuksiin, hankitaan
tekstin ja puheen koneellisen käsittelyn alkeistaidot ja tutustutaan
johonkin valinnaiseen kieliteknologian erikoisalaan.
Pakolliset osiot, pääaineopiskelijalle 22 op,
sivuaineopiskelijalle 21 op.
(1) Kielitiedettä kieliteknologiaa varten
pääaineopiskelijalle 10 op. Sivuaineopiskelijalle 7-10 op, jolloin
toisen harjoituskursseista voi korvata vapaavalintaisella osiolla.
-
Yleisen kielitieteen perusteet: Clt110 (2 op)
-
Esitietovaatimukset: Ei esitietovaatimuksia
-
Sisältö:
Ks. yleisen kielitieteen tutkintovaatimuskohta Cyk110.
-
Korvaavat suoritustavat:
Voidaan suorittaa esim. opintojaksolla Cyk110 ks. yleinen
kielitiede.
-
Fonetiikan perusteet: Clt120 (2 op)
-
Esitietovaatimukset: Ei esitietovaatimuksia
-
Sisältö:
Fonetiikka tieteenalana, äänteiden kuvaamisen perusteet
akustisesti sekä artikulatorisesti, keskittyen kuitenkin
artikulatoriseen kuvaukseen. Kuvauksia käytetään pohjana
foneettisille aakkosille, joiden avulla eri kielten äänteet
voidaan luokitella systemaattisesti. IPA-aakkoston periaatteet.
-
Vastuuopettaja: Puheteknologian yliopistonlehtori
-
Fonologian ja morfologian harjoitukset: Clt111 (3 op)
-
Esitietovaatimukset:
Yleisen kielitieteen perusteet, ks.Clt110
-
Sisältö:
Ks. yleisen kielitieteen tutkintovaatimusten kohta Cyk130.
-
Korvaavat suoritustavat:
Voidaan suorittaa esim. Fonologian ja morfologian
harjoituskurssilla Cyk130 ks. yleinen kielitiede
-
Syntaksin harjoitukset: Clt125 (3 op)
-
Esitietovaatimukset: Yleisen kielitieteen perusteet, ks. Clt110
-
Sisältö:
Ks. yleisen kielitieteen tutkintovaatimusten kohta Cyk140.
-
Korvaavat suoritustavat:
Voidaan suorittaa esim. opintojaksolla Cyk140 ks. yleinen
kielitiede
(2) Teknisiä taitoja kieliteknologiaa varten
Pääaineopiskelijalle 6 op, sivuaineopiskelijalle 8 op
Pääaineopiskelijalle pakolliset osiot ovat Clt131 ja
Clt132. Kieliteknologian ja yleisen kielitieteen
pääaineopiskelijoille kohta Clt130 on pakollinen ja se kirjataan
osaksi humanistisen tiedekunnan TVT-opintokokonaisuutta (eikä
lasketa osaksi heidän perusopintojensa kokonaisuutta).
-
Kieliteknologian ATK-ympäristö: Clt130 (2 op)
-
Esitietovaatimukset:
On hyödyllistä, jos on aiempaa kokemusta tietokoneiden käytöstä,
mutta tämä ei ole mitenkään välttämätöntä.
-
Sisältö:
Tavoitteena on tutustua yleisen kielitieteen laitoksen
ATK-ympäristön erityispiirteisiin ja oppia hyödyntämään niitä
sekä laitoksen tiloissa että tietoverkkojen läpi. Opitaan
Unix-järjestelmän ja -ohjelmien peruskäyttötaidot:
kirjoittautuminen, istunnon päättäminen, verkkoselain,
sähköposti, tiedostojärjestelmä, tekstin muokkaus Emacs-editorin
avulla, käyttö työasemalla ja palvelimen etäkäyttö, tiedostojen
suojaukset.
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
-
Korpusten käsittely: Clt131 (3 op)
-
Esitietovaatimukset:
Kieliteknologian ATK-ympäristön tuntemus, esim. Clt130.
-
Sisältö:
Opitaan laatimaan tietokonemuotoisia tekstiaineistoja sekä
muokkaamaan niitä. Lisää Emacs-editorin käytöstä. Poimitaan ja
muokataan rivejä Unixin komentojen avulla. Opitaan yhdistämään
yksinkertaisia komentoja komentosarjoiksi. Säännöllisten
lausekkeiden käsite ja peruskäyttö. Valmiin, tiedostossa olevan
puhesignaalin visualisointi. Tekstin yksinkertainen
normalisointi, sananmuotojen frekvenssit, konkordanssi.
Näytteitä erilaisista kieliaineistoista ja morfologisten ja
syntaktisten jäsentimien tuotoksista, esimerkkejä morfologisista
ja syntaktisista annotoinneista.
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
-
Rakenteisten dokumenttien perusteet: Clt132 (3 op)
-
Esitietovaatimukset: Kieliteknologian ATK-ympäristön tuntemus, esim. Clt130
-
Sisältö:
Rakenteisten ja rakenteettomien (näköis- eli
WYSIWYG-dokumenttien) dokumenttien väliset erot. Rakenteen
merkkaus XML:n mukaisesti: alkiot ja attribuutit. Sopimukset
tietyn rakenteen noudattamisesta (DTD), hyvinmuodostetut ja
validoidut dokumentit. XHTML- ja HTML-kielten alkeet ja niiden
erot. Rakenteisen dokumentin ulkonäön säätely ja
CSS-muotoilukielen alkeita. Opitaan tunnistamaan XML-muotoisen
tiedon rakenne, editoimaan XML-muotoista dokumenttia sekä
laatimaan XHTML-dokumentti.
-
Kirjallisuus:
Verkkomateriaalia, mm. http://www.w3.org
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
(3) Johdanto kieliteknologiaan 6 op pää-ja
sivuaineopiskelijalle, 4 op TKK:n kieliteknologian opiskelijalle
sekä 3 op yleisen kielitieteen opiskelijalle
-
Kieliteknologian johdanto ja harjoitukset: Clt140 (3-6 op)
-
Esitietovaatimukset:
Kieliteknologian ATK-ympäristö, esim. Clt130,
(tai muuten hankittu taito käyttää verkkoselainta ja
sähköpostia), Yleisen kielitieteen perusteet, esim.
Clt110, tai vastaavat tiedot
-
Sisältö:
Johdatusta ymmärtämään kielen olemus kieliteknologian kannalta
eli kielen automaattisen tunistamisen ja tuottamisen vaativuus.
Kieliteknologian merkitys ja sen mahdollisuuksien tunnistaminen
niin tämän päivän kuin tulevaisuudenkin sovelluksissa.
Kirjoittajan apuvälineiden, vuorovaikutteisten sovellusten,
tiedonhaun, kielen oppimisen ja kielen kääntämisen tärkeimmät
kieliteknologiset apuvälineet.
-
Kirjallisuus:
Verkkomateriaalia, mm. kurssimoniste ja oheislukemistona osia
teoksista (1) Ruslan Mitkov (ed.), The Oxford Handbook of
Computational Linguistcs, Oxford University Press, 2003, (2)
Daniel Jurafsky and James H. Martin, Speech and Language
Processing, Prentice Hall, NJ, 2000.
-
Vastuuopettaja: Kimmo Koskenniemi
(4) Valinnaiset osiot
Sikäli, kun kielitieteen tai teknisten taitojen osioista on muihin
kokonaisuuksiin sisällytetty vastaavia osia, niitä ei suoriteta
kieliteknologiassa uudestaan, vaan tilalle voi valita
vapaavalintaisia osioita, esim.:
-
Semantiikan ja pragmatiikan harjoitukset: Clt113 (3-5 op)
-
Sisältö:
Ks. yleisen kielitieteen tutkinovaatimusten kohta Cyk150.
-
Korvaavat suoritustavat:
Voidaan suorittaa esim. harjoituskurssilla Cyk150 ks. yleinen
kielitiede
-
Fonetiikan harjoitukset: Clt121 (2-5 op)
-
Esitietovaatimukset:
Fonetiikan perusteet esim. Clt120
-
Sisältö:
Puhe tutkimuskohteena, puhesignaali ja sen segmentaaliset ja
suprasegmentaaliset piirteet, puhesignaalin auditiivinen
analyysi, foneettisen transkription perusteet, puheäänteiden
akustiikkaa ja psykoakustiikkaa, prosodisten muuttujien vaikutus
puheeseen.
-
Johdanto puheen akustiikkaan: Clt122 (3-5 op)
-
Esitietovaatimukset:
Fonetiikan perusteet esim. Clt120
-
Sisältö:
Tavoitteena on kokonaiskäsitys puheen tuottoon
liittyvistä akustisista ilmiöistä, kuten ääniaallot, äänekkyys
ja äänenkorkeus, äänenlaatu, resonanssi, ääniväylän resonanssit
ja kuulon toimintaan sekä äänen analyysiin tutustuminen.
-
Vastuuopettaja: Puheteknologian yliopistonlehtori
-
Tietokoneavusteinen kääntäminen: Cmo241 (3-5 op)
-
Esitietovaatimukset:
Käsitys kääntäjän työstä; tietotekniikan perustaidot.
-
Sisältö:
Tavoitteena on selvittää miten kääntäjä voi käyttää
tietoteknikkaa ja sähköistä viestintää työssään. Tutustutaan
seuraaviin työkaluihin (sisältö vaihtelee vuosittain):
Rakenteisten dokumenttien hallinta, tiedonhaku webistä,
elektroniset sanalistat, sanakirjat ja tietosanakirjat,
verkkosanakirjat, oikoluku- ja kielentarkistusohjelmat,
termipankit, terminhallinta- ja sanastusohjelmat,
käännösmuistit, konekäännös
-
Vastuuopettaja: Lauri Carlson
Clt200 Aineopinnot 45 op, sivuaineena 35 op
Vastuuopettaja: Kimmo Koskenniemi
Aineopinnoissa perehdytään käytännössä kieliteknologian
menetelmiin ja resursseihin, syvennetään kieliteknologian teknisiä
ja ammatillisia taitoja sekä harjoitellaan alan tutkijan
valmiuksia.
(5) Kieliteknologian ammattitaitoja 9 op
-
Ohjelmoinnin perusteet: Clt230 (3 op)
-
Esitietovaatimukset:
Unix-järjestelmän käytön sekä Emacs-editorin perustuntemus,
esim. Clt130
-
Sisältö:
Tekstin ja muun tiedon käsittely laatimalla lyhyitä ohjelmia,
ohjelmissa olevien virheiden etsiminen ja korjaaminen,
ohjelmoinnin perusasiat siekä niihin liittyvät käsitteet kuten
toisto, ehdollisuus, aliohjelma ja parametri.
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
-
Rakenteisten dokumenttien käsittely: Clt232 (3 op)
-
Esitietovaatimukset:
Rakenteisten dokumenttien perusteet, esim. Clt132
-
Sisältö:
XML-standardi yksityiskohtaisemmin (yksiselitteiset tunnukset,
linkitys, nimiavaruudet); XML-jäsennin ja validointi; DTD ja
skeema(t); XSLT-muunnokset; LaTeX rakenteisena dokumenttina ja
LaTeX-dokumenttien tekeminen;
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
-
Kielenkäsittelymoduulien evaluointi: Clt250 (3 op)
-
Esitietovaatimukset:
Ohjelmoinnin perusteet, esim. Clt230 tai vastaavat tiedot ja taidot.
-
Sisältö:
Johdatusta ymmärtämään evaluoinnin olemus kieliteknologiassa eli
kielen automaattisen tunnistamisen ja tuottamisen
onnistuneisuuden arviointi. Tilastollisen testaamisen perusteet;
tavallisimpia tilastollisia testejä; tilastollinen merkitsevyys;
kielenkäsittelymoduulien tuotos tilastollisena aineistona;
kielenkäsittelymoduulin arvioiminen. Kurssilla opetellaan myös
käyttämään tilastollista järjestelmää (esim. R:ää).
-
Kirjallisuus:
Verkkomateriaalia ja oheislukemistona osia teoksista: (1)
R. H. Baayen, Word Frequency Distributions, Kluwer
Academic Publishers, Dordrecht, 2001. (2)
http://cran.r-project.org/doc/manuals/R-intro.pdf 96 s.
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
(6) Kieliohjelmat ja kieliresurssit 6 op
-
Morfologiset kielenkäsittelyohjelmat: Clt260 (3 op)
-
Esitietovaatimukset:
Yleisen kielitieteen perustiedot, esim. yleisen kielitieteen
perusteet Ctl110, kieliteknologian perustiedot, esim.
Clt140, sekä perustietoja morfologiasta, esim. Clt111.
-
Sisältö:
Morfologian ilmiöt jäsennysongelmina, käytössä olevien
jäsennysmenetelmien toimintaperiaatteet ja annotaatiot, kielen
kuvaaminen ao. menetelmillä. Morfologisen jäsentimen syötteet ja
tulosteet; Morfologian ja fonologian ymmärtämistä tällaisessa
viitekehyksessä.
-
Kirjallisuus:
Richard Sproat, Morphology and Computation (osia),
verkkomateriaalia.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Syntaktiset kielenkäsittelyohjelmat: Clt261 (3 op)
-
Esitietovaatimukset:
Yleisen kielitieteen perustiedot, esim. Yleisen kielitieteen
perusteet Clt110, Kieliteknologian johdantokurssi ja
harjoitukset Clt140 (tai muuten hankitut kieliteknologian
perustiedot), sekä perustietoja syntaksista, esim. Syntaksin
harjoitukset Clt125
-
Sisältö:
Syntaksin ilmiöt jäsennysongelmina, käytössä olevien
jäsennysmenetelmien toimintaperiaatteet ja annotaatiot, kielen
kuvaaminen ao. menetelmillä. Sanaluokkajäsennys (tagging),
lausekkeiden tunnistus (chunking), pintajäsennys (surface
parsing), syväjäsennys (deep parsing).
-
Vastuuopettaja: Kimmo Koskenniemi
(7) Kieliteknologian menetelmät 10 op
-
Äärellistilaiset jäsennysmenetelmät: Clt270 (3 op)
-
Esitietovaatimukset:
Ohjelmoinnin perusteet esim. Clt230,
Morfologiset kielenkäsittelyohjelmat esim. Clt260.
-
Sisältö:
Pienimuotoisen morfologisen jäsentimen laatiminen
äärellistilaisten transduktorien avulla esim. XFST:n avulla.
Transduktorileksikko ja sen rakenne, fonologiset säännöt ja
näiden yhteispeli.
-
Kirjallisuus:
Kenneth R. Beesley and Lauri Karttunen, Finite State
Morphology, CSLI Publications, 2003.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Kontekstittomat jäsennysmenetelmät ja Prolog: Clt271 (4 op)
-
Esitietovaatimukset:
Ohjelmoinnin perusteet, esim. Clt230, syntaktiset
kielenkäsittelyohjelmat, esim. Clt261, tietoja syntaksin
teorioista, esim. Clt125
-
Sisältö:
Lausekekielioppipohjaisten kielioppien (context-free grammar)
kirjoittaminen ja jäsentäminen, tarvittava Prolog-kielen
taito. Osittava (top-down) ja kokoava (bottom-up) jäsennys,
taulukkojäsennys, leksikko ja leksikaaliset säännöt,
piirrerakenteet, HPSG-kielioppi (Head-driven Phrase Structure
Grammar)
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
-
Puhesynteesin perusteet: Clt220 (3 op)
-
Esitietovaatimukset:
Fonetiikan perusteet, esim. Clt120, Johdanto kieliteknologiaan,
esim. Clt140, tai vastaavat tiedot.
-
Sisältö:
Tavoitteena on antaa yleiskäsitys tekstistä puhetta muokkaavien
järjestelmien toiminnasta ja niiden käyttämistä
tekniikoista. Tutustutaan puhesynteesin historiaan,
formanttisynteesiin, tekstin analyysiin, difonikonkatenaatioon
ja unit selection -tekniikoihin sekä TTS
(Text-to-Speech)-menetelmään.
-
Vastuuopettaja: Puheteknologian yliopistonlehtori
(8) Tutkijan taidot 10 op pääaineopiskelijoille
-
Proseminaari: Clt240 (4 op)
-
Esitietovaatimukset:
Aineopintojen tärkeimät kurssit on hyvä olla suoritettuina.
-
Sisältö:
Suullinen ja kirjallinen esitys. Proseminaarissa tehdään
kieliteknologisesta aiheesta esitelmä, posteri tai
verkkosivu. Kandidaatintutkielman suunnittelu ja suunnitelman
esittely.
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
-
Kandidaatintutkielma: Clt241 (6 op)
-
Sisältö:
Johonkin kieliteknologiseen aiheeseen liittyvä itsenäinen työ ja
siitä tehty n. 15 sivun kirjallinen raportti. Tavoitteena on,
että kirjallinen työ valmistuu proseminaarin aikana.
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
(9) Ammattiin orientointi 4 op pääaineopiskelijoille,
sivuaineopiskeljat valitsevat tilalle vapaavalintaisen osion.
-
Henkilökohtainen opintosuunnitelma, HOPS: Clt280 (1 op)
-
Sisältö:
HOPS suunnitellaan yhdessä opettajatuutorin kanssa aineopintojen
alussa. HuK-tutkinnon rakenne, siihen kuuluvat opinnot sekä
opintojen eteneminen. Tieteenalaan tutustuminen ja oman
oppimisen arviointi.
-
Vastuuopettaja: Opettajatuutori
-
Työelämään orientoiva osio: Clt281 (3 op)
-
Sisältö:
Suoritetaan esim. opintokohde Projektinhallinta Clt310pro
samanaikaisesti henkilökohtaisen opintosuunnitelma työstämisen
kanssa.
(10) Valinnaiset osiot 6 op pääaineopiskelijoille, 10 op
sivuaineopiskelijoille
Sikäli kun aineopintojen osioista on muihin kokonaisuuksiin
sisällytetty vastaavia osia, ei niitä suoriteta kieliteknologiassa
uudestaan, vaan tilalle voi valita vapaavalintaisia osioita,
esim.:
-
Harjoittelu: Clt282 (3 op)
-
Sisältö:
Tavoitteena opetus- tai työkokemuksen hankkiminen. Voi
suorittaa toimimalla luennoitsijan ohjaamana
kurssiassistenttina tai muussa ohjatussa opetustehtävässä tai
esim. valtionhallinnon harjoittelussa tai alan yrityksessaä,
mistä tekee raportin.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Avoimen koodin kieliteknologia: Clt262 (3-5 op)
-
Esitietovaatimukset:
Java-ohjelmointikielen perusteet, XML ja XSLT
-
Sisältö:
Vapaan koodin lisensseistä, mm. GPL. Avoimen lähdekoodin
ohjelmien asentaminen: Xerces ja Xalan. Avoimen lähdekoodin
ohjelmien käyttö: Java and XSLT, ohjelmien testaaminen,
IDE-ohjelmat, tietokantaohjelmat, GATE, WordNet.
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
-
Puheaineistot: Clt222 (3-5 op)
-
Esitietovaatimukset:
Fonetiikan perusteet (mielellään myös fonetiikan harjoitukset),
esim. Ctl120 ja Clt121 sekä kieliteknologian perusteet, esim. Ctl140
-
Sisältö:
Digitaalisten puheaineistojen ja puhetietokantojen käsittely
erilai sten työkalujen avulla, puhekorpusten suunnittelu,
tekeminen ja annotointi, puheen an notointi, puhekorpusten
käyttö tutkimuksessa.
-
Vastuuopettaja: Puheteknologian yliopistonlehtori
-
Käytännön puheteknologiasovellukset: Clt221 (3-5 op)
-
Sisältö:
Tutustutaan puheteknologisiin sovelluksiin ja teknologioihin.
Voi suorittaa esim. KIT-verkostossa.
-
Muu kieliteknologian erikoiskurssi: Clt290 (3-5 op)
-
Sisältö:
Yleisen kielitieteen, muiden yhteistyölaitosten tai
KIT-verkoston opintoja sopimuksen mukaan.
-
Vastuuopettaja: Kimmo Koskenniemi
Syventävät opinnot 80 op
Vastuuopettaja: Kimmo Koskenniemi
Syventävissä opinnoissa täydennetään kieliteknologian teknisiä ja
ammatillisia taitoja, perehdytään alan keskeisiin teorioihin ja
malleihin ja hankitaan taito tehdä suunnitelmallista selvitys- ja
tutkimustyötä.
(11) Kieliteknologian teoriat ja menetelmät 9 op
-
Äärellistilaisten jäsennysmenetelmien teoria: Clt370 (3 op)
-
Sisältö:
Äärellistilaisten automaattien ja transduktorien kalkyyliä ja
erilaisten jäsennysmenetelmien toteuttaminen tällaisilla
menetelmillä.
-
Kirjallisuus:
Emmanuel Roche and Yves Shabes (eds), Finite-State Language
Processing. MIT Press, 1997.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Syntaktisten jäsennysmenetelmien teoria: Clt371 (3 op)
-
Esitietovaatimukset:
Perustiedot jäsentämisestä, esim. Syntaktiset
kielenkäsittelyohjelmat Clt261, Kontekstittomat
jäsennysmenetelmät esim. Clt271
-
Sisältö:
Luonnollinen kieli ja formaalikielten teoria, kielioppimalleista
(äärellistilaiset, lauseke-, dependenssi-, kategoria- ja
piirrekieliopit), jäsennysmenetelmistä
(deterministinen vs. nondeterministinen, kokoava vs. karsiva,
tulkkaava vs. kääntävä), jäsennyksen vaiheistus, jäsennyssuunnat ja
-järjestykset, jäsennyksen vaativuus, kieliopin ja leksikon
työnjako, jäsennys vastaan generointi.
-
Vastuuopettaja: Kieliteknologian yliopistonlehtori
-
Tilastollispohjaiset jäsennysmenetelmät: Clt350 (3 op)
-
Esitietovaatimukset:
Johdanto kieliteknologiaan, esim. Clt140,
kielenkäsittelymoduulien evaluointi, esim. Clt250.
-
Sisältö:
Johdatusta ymmärtämään kielen tilastollinen olemus
kieliteknologian kannalta eli kielen automaattisen tunnistamisen
ja tuottamisen tilastollinen vaativuus. Tilastollisen
kieliteknologian merkitys ja sen mahdollisuuksien tunnistaminen
niin tämän päivän kuin tulevaisuudenkin sovelluksissa.
Kirjoittajan apuvälineiden, vuorovaikutteisten sovellusten,
tiedonhaun, kielen oppimisen ja kielen kääntämisen tärkeimmät
tilastopohjaiset kieliteknologiset apuvälineet.
-
Kirjallisuus:
Verkkomateriaalia ja oheislukemistona osia teoksista: (1)
Christopher D. Manning and Hinrich Schütze, Foundations of
Statistical Natural Language Processing, The MIT Press, 1999,
(2) Daniel Jurafsky and James H. Martin, Speech and Language
Processing, Prentice Hall, NJ, 2000.
-
Vastuuopettaja: Kimmo Koskenniemi
(12) Ammatillisuus ja tutkijan taidot 14 op,
kieliteknologian ja puheteknologian seminaarit vaihtoehtoisia
-
Seminaari: Clt340 (10 op)
-
Sisältö: Laajempien harjoitustöiden ja pro gradu -tutkielman
tekijöille, jossa voidaan raportoida suunnitelmia ja työn eri
vaiheiden tuloksia ja ongelmia.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Puheteknologian seminaari: Clt320 (10 op)
-
Sisältö: Laajempien harjoitustöiden ja pro gradu -tutkielman
tekijöille, jossa voidaan raportoida suunnitelmia ja työn eri
vaiheiden tuloksia ja ongelmia.
-
Vastuuopettaja: Puheteknologian yliopistonlehtori
-
Henkilökohtainen opintosuunnitelma ja
työelämäorientaatio: Clt380 (4 op)
-
Sisältö:
HOPS sisältää syventävien opintojen ja pro gradu-työn
suunnittelua sekä vapaastivalittavien opintojen kartoitusta ja
valintaa graduaiheen mukaan. Työelämäorientaatio-osion voi
suorittaa esim. kursseilla Clt310ipr Tekijänoikeudet tai
Clt310com Teknologian kaupallistaminen tai työkokemuksella
kieliteknologian alan projektissa.
-
Vastuuopettaja: Opettajatuutori
(13) Valinnaiset opinnot 20 op
-
Kieliteknologian historia: Clt310hist (3-5 op)
-
Sisältö:
Perehtyminen kieliteknologian aiempiin vaiheisiin ja
merkkipaaluihin.
-
Kirjallisuus:
Joukko verkkosivulla lueteltuja klassikkoartikkeleita ja
-kirjoja, sovitaan etukäteen tenttijän kanssa.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Äärellistilaiset automaatit : Clt310fs (3-5 op)
-
Sisältö:
Äärellistilaisten automaattien ja transduktorien algebraa,
yhdiste, leikkaus, kompositio, determinisointi, minimointi.
Erilaisten asioden tekemistä olemassa olevien ohjelmien avulla.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Semantic Web: Clt310semw (3-5 op)
-
Esitietovaatimukset:
Java-ohjelmointi, XML, XML Schema, XHTML, relaatiotietokannat ja
SQL, esim. Avoimen lähdekoodin kieliteknologia Clt262
-
Sisältö:
W3C-konsortion Semantic Web-aloite koostuu keinoista tehostaa
webissä olevan tiedon koneellista hakua ja käsittelyä
rakenteisen metadatan avulla. Keskeisiä Semantic Web-tekniikoita
ja kuvauskieliä ja niiden yhdistämistä
kieliteknologiaan. Semantic Web: XML, metadata ja ontologiat,
RDF (Resource Description Framework) ja RDF Schema RDF:n
käsittely Javalla: Jena-työkalupakki, RDF:n talletus
SQL-tietokannassa: Jenan RDQL-kyselykieli. Ontologiatyö:
Protégé ontologiaeditori, ontologiakielet: RDFS, DAML+OIL,
OWL, luonnollisen kielen ontologiat: WordNet, OntoWordNet,
FrameNet.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Koneoppiminen: Clt310ml (3-5 op)
-
Esitietovaatimukset:
Kielenkäsittelymoduulien evaluointi, esim.Clt250, ohjelmoinnin
perusteet, esim. Ctl230
-
Sisältö:
Johdatusta ymmärtämään mitä koneoppiminen voi tarjota
kieliteknologian kannalta eli kielen automaattisen tunnistamisen
ja tuottamisen sovittaminen eri käyttötilanteisiin. Johdanto
koneoppimiseen kieliteknologiassa: ohjattua oppimista (aineiston
luokittelu esimerkkien perusteella), puoliohjattua oppimista
(aineiston luokittelu siemenesimerkkien perusteella),
puoliohjaamatonta oppimista (aineiston ryhmittely tai
visualisointi viiteaineiston mukaan), ohjaamatonta oppimista
(aineiston ryhmittely tai visualisointi suoraan). Koneoppimisen
hyödyntäminen kirjoittajan apuvälineiden, vuorovaikutteisten
sovellusten, tiedonhaun, kielen oppimisen ja kielen kääntämisen
tärkeimmissä kieliteknologisissa apuvälineissä.
-
Kirjallisuus:
Verkkomateriaalia ja oheislukemistona osia teoksista: (1) Ruslan
Mitkov (ed.), The Oxford Handbook of Computational Linguistcs,
Oxford University Press, 2003, (2) Daniel Jurafsky and James
H. Martin, Speech and Language Processing, Prentice Hall, NJ,
2000. (3) Christopher D. Manning and Hinrich Schütze,
Foundations of Statistical Natural Language Processing, The MIT
Press, 1999.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Luonnollisen kielen generointi: Clt310gen (3-5 op)
-
Esitietovaatimukset: Java-ohjelmointi, XML, XML Schema ja XSLT
esim. Clt230, Java, Ant, SQL, WordNet, esim. Clt262,
yleisen kielitieen perustiedot: morfologia, syntaksi, semantiikka,
esim. Clt110
-
Sisältö:
Tutustuminen luonnollisen kielen tuottamiseen: ongelmat,
tekniikat, tehtävät, arkkitehtuurit, tekstin ja dialogin
generointi. Johdatus generointiin, generointiarkkitehtuurit,
generointivaiheet, templaattipohjainen generointi, pinta-ja
syvägenerointi, XML-pohjainen generointi, dialogin generointi.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Dialogin mallinnus: Clt310dia (3-5 op)
-
Esitietovaatimukset: Kieliteknologian perusopinnot
-
Sisältö:
Keskustelu vs. dialogi, keskustelujen litterointi, dialogin
mallintaminen, tutustuminen dialogin mallinnusta kehittäviin
projekteihin (esim. Interact).
-
Kirjallisuus:
M.McTear: Spoken Dialogue Technology: Enabling the
Conversational User Interface
-
Vastuuopettaja: Lauri Carlson
-
Tietokoneavusteinen kielen oppiminen : Clt310call (3-5 op)
-
Esitietovaatimukset: Yleisen kielitieteen perustiedot: morfologia, syntaksi,
semantiikka, esim.Clt110 sekä perustiedot ohjelmoinnista, esim
Clt230
-
Sisältö: Tutustuminen kielen opettamisen kieliteknologiaan:
ongelmat, tekniikat, tehtävät, ratkaisut, CALL:in historia,
CALL:iin soveltuvat kieliteknologiat, olemassaolevat
CALL-ratkaisut, alan tutkimuksen nykytila ja mahdollisuudet
-
Vastuuopettaja: Kimmo Koskenniemi
-
Korpukset ja kieli: Clt310corp (3-5 op)
-
Esitietovaatimukset:
Ei esitietovaatimuksia.
-
Sisältö:
Kurssin tavoitteena on kokemusperäisesti tarkastella, miten
korpuksia voidaan käyttää kielen tutkimuksessa, minkälaisia
tutkimuskysymyksiä korpuksille kannattaa esittää, miten
korpuksia kannattaa tutkia sekä mitä tulosten pohjalta voidaan
sanoa kielestä.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Teknologian kaupallistaminen: Clt310com (3-5 op)
-
Esitietovaatimukset: Ei esitietovaatimuksia
-
Sisältö:
Tavoitteena on tarkastella kieliteknologisen ja
kielitieteellisen teorian kaupallistamiseen ja tuotteistamiseen
liittyviä erityiskysymyksiä ja antaa yleiskuva kieliteknologiaan
pohjautuvasta liiketoiminnasta Suomessa, Pohjoismaissa ja
muualla maailmassa. Kaupallinen kieliteknologia käytännössä,
Suomessa ja muissa Pohjoismaissa, kieliteknologiset
tuotekehitysprojektit, kaupallisen kieliteknologian tulevaisuus:
mahdollisuudet ja karikot.
-
Kirjallisuus: Naumanen, Mika 2002. Nuorten
teknologiayritysten menestystekijät. SITRAn raportteja sarja,
ISSN 1457-5728; 28. Edita Publishing Oy, Helsinki.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Projektinhallinta: Clt310pro (3-5 op)
-
Esitietovaatimukset:
Ei esitietovaatimuksia, mutta luentomateriaaliin etukäteen
tutustumista suositellaan.
-
Sisältö:
Kurssin tavoitteena on antaa yleiskuva siitä, mitä projektit
ovat, minkälaista on työskennellä projekteissa, ja miten
projekteja suunnitellaan, seurataan ja johdetaan. Kurssilla
näkökulmana on kieliteknologin työuralle tyypillinen
projektitoiminta.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Tekijänoikeudet: Clt310ipr (3-5 op)
-
Esitietovaatimukset:
Ei varsinaisia esitietovaatimuksia. Tarkoitettu syventäviä
opintoja suorittaville, joten opiskelijoilla oletetaan olevan
perustiedot yleisimmistä kieliteknologisista sovelluksista ja
aiheen kannalta relevanteista lingvistisistä menetelmistä.
-
Sisältö:
Tavoitteena on perehdyttää opiskelija immateriaalioikeuden
järjestelmään ja keskeisiin käsitteisiin yleisellä tasolla sekä
antaa valmiuksia soveltamaan immateriaalioikeutta
kieliteknologin tai lingvistin tyypillisesti kohtaamissa
käytännön tilanteissa. Tekijänoikeus ja lähioikeudet,
teollisoikeudet, immateriaalioikeudet ja korpukset, internet,
kieliteknologiatuotteet ja tutkimus.
-
Vastuuopettaja: Kimmo Koskenniemi
-
Muu kieliteknologian erikoiskurssi: Clt310 (3-5 op)
-
Sisältö:
Yleisen kielitieteen, muiden yhteistyölaitosten tai
KIT-verkoston opintoja sopimuksen mukaan.
-
Vastuuopettaja: Kimmo Koskenniemi
(14) Pro gradu -tutkielma 40 op
-
Pro Gradu-tutkielma: Clt800 (40 op)
-
Sisältö:
Pro gradu -tutkielman tulee osoittaa pääaineopiskelijan kykyä
ymmärtää ja soveltaa kieliteknologisia menetelmiä. Tutkielman
pituus on tavallisesti 40-70 sivua. Tutkielman suunnitelma
aikatauluineen tulee hyväksyttää ohjaajalla, jotta työn
edistyminen voidaan varmistaa. Kieliteknologiassa on pyrkimys
siihen, että huomattava osa tutkielmista voitaisiin tehdä
palkallisina yrityksissä tai tutkimushankkeissa.
-
Vastuuopettaja: Kimmo Koskenniemi
|