Yliopiston etusivulle Suomeksi
Helsingin yliopisto
kpk350: Tilastollispohjaiset jäsennysmenetelmät (Clt350/Kpk350) - syksy 2006

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 Helsingin yliopisto

Puhelinvaihde +358 (09) 1911
Faksi +358 (09) 191 29307

Kurssikuvaus

Esitiedot:

  • Yleiset tiedot kieliteknologiasta, esim. Kieliteknologian johdantokurssi ja harjoitukset (Clt140)
  • Yleisiä tietoja todennäköisyydestä ja tilastotieteestä, sekä R-ohjelmasta, esim. Kielenkäsittelymoduulien evaluointi (Clt250)

Tavoitteet:

  • Ymmärtää kielen tilastollista olemusta ja tilastollisen kieliteknologian merkitystä sekä mahdollisuuksia nykyisissä ja tulevissa sovelluksissa.
  • Pääpiirteittäinen perehtyminen joihinkin tilastollisen kielenkäsittelyn ja jäsentämisen menetelmiin.

Kurssin sisältö:

  • Todennäköisyyslaskennan peruskäsitteitä ja niiden sovelluksia kielimateriaaliin.
  • Markovin piilomalli

Kirjallisuus:

  • Christopher D. Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, The MIT Press, 1999 (osia)
  • Brigitte Krenn and Christer Samuelsson, The Linguist's Guide to Statistics Don't Panic (1997) (osia)

Kurssin laajuus opintopisteinä:

  • 3 op (ks. tutkintovaatimukset)

Opetus

Opettaja:

  • Kimmo Koskenniemi ja Seppo Nyrkkö

Suoritustapa:

  • Omatoimista perehtymistä, keskustelua, harjoitustehtäviä.

Paikka ja aika:

  • Tiistaisin klo 9-12 Unix-luokassa 5.9. - 17.10.2006

Ilmoittautuminen:

  • Kurssi on tarkoitettu erityisesti KPK-maisteriohjelman vuonna 2006 aloittaneille opiskelijoille. Muiden on tarkoitus suorittaa TKK:n keväällä 2007 tarjoama vastaava kurssi.

Kurssimateriaali:

  • Verkossa ja osittain kirjoissa.