Yliopiston etusivulle Suomeksi
Helsingin yliopisto
kpk350: Tilastollispohjaiset jäsennysmenetelmät (Clt350/Kpk350) - syksy 2006

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 Helsingin yliopisto

Puhelinvaihde +358 (09) 1911
Faksi +358 (09) 191 29307

Kurssikuvaus

Esitiedot:

 • Yleiset tiedot kieliteknologiasta, esim. Kieliteknologian johdantokurssi ja harjoitukset (Clt140)
 • Yleisiä tietoja todennäköisyydestä ja tilastotieteestä, sekä R-ohjelmasta, esim. Kielenkäsittelymoduulien evaluointi (Clt250)

Tavoitteet:

 • Ymmärtää kielen tilastollista olemusta ja tilastollisen kieliteknologian merkitystä sekä mahdollisuuksia nykyisissä ja tulevissa sovelluksissa.
 • Pääpiirteittäinen perehtyminen joihinkin tilastollisen kielenkäsittelyn ja jäsentämisen menetelmiin.

Kurssin sisältö:

 • Todennäköisyyslaskennan peruskäsitteitä ja niiden sovelluksia kielimateriaaliin.
 • Markovin piilomalli

Kirjallisuus:

 • Christopher D. Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, The MIT Press, 1999 (osia)
 • Brigitte Krenn and Christer Samuelsson, The Linguist's Guide to Statistics Don't Panic (1997) (osia)

Kurssin laajuus opintopisteinä:

 • 3 op (ks. tutkintovaatimukset)

Opetus

Opettaja:

 • Kimmo Koskenniemi ja Seppo Nyrkkö

Suoritustapa:

 • Omatoimista perehtymistä, keskustelua, harjoitustehtäviä.

Paikka ja aika:

 • Tiistaisin klo 9-12 Unix-luokassa 5.9. - 17.10.2006

Ilmoittautuminen:

 • Kurssi on tarkoitettu erityisesti KPK-maisteriohjelman vuonna 2006 aloittaneille opiskelijoille. Muiden on tarkoitus suorittaa TKK:n keväällä 2007 tarjoama vastaava kurssi.

Kurssimateriaali:

 • Verkossa ja osittain kirjoissa.