Kieliteknologian oppiaine

Ctl142

- KIT-verkosto | Yleisen kielitieteen laitos| Kieliteknologian opetus| Helsingin yliopisto -
Kurssin sivut
Kurssin kalenteri
Kurssin materiaali
Luennoitsija
Kurssin kuvaus

KIT Ctl142, 2003k:
Automaattinen syntaktinen analyysi

Kurssikuvaus

Esitiedot:

 • Yleisen kielitieteen perustiedot, esim. yleisen kielitieteen peruskurssi Cyk110,
 • kieliteknologian perustiedot, esim. kieliteknologian johdantokurssi Ctl190 sekä
 • perustietoja syntaksista, esim. syntaksin harjoituskurssi Cyk140.

Tavoitteet:

 • Saada käsitys syntaksin ilmiöistä jäsennysongelmina.
 • Ymmärtää eräiden jäsennysmenetelmien toimintaperiaatteita.
 • Harjoitella kielten kuvaamista asianomaisilla menetelmillä.

Kurssin sisältö:

 • Sananmuotojen ratkonta (tagging)
 • Lausekkeiden tunnistus (chunking)
 • Pintajäsennys (surface parsing)
 • Syväjäsennys (deep parsing)

Kirjallisuus:

 • F. Karlsson, A. Voutilainen, J. Heikkilä, A. Anttila, (ed.) Constraint Grammar: A Language-Independent System for Parsing Unrestricted Text, Mouton de Gruyter, 1995, luvut 1-2
 • Yllä mainitusta kirjasta voi lukea myös luvut 3-6, mutta helpommin saa yleiskuvan englannin kieleen sovelletusta CG:stä laitoksen julkaisusta nro 21: Atro Voutilainen, Juha Heikkilä, Arto Anttila: Constraint Grammar of English: A Performance-Oriented Introduction, 1992. Tästä kirjasesta saa luennoitsijalta kuittausta vastaan kappaleen lainaksi kurssin ajaksi.
 • K. Koskenniemi, "Finite-state Parsing and Disambiguation", pp. 229-232, COLING-90.
 • E. Roche, Y. Schabes, (ed.), Finite-State Language Processing, MIT Press, 1997, luvut 8-10
 • Eric Brill, "Some Advances in Transformation-Based Part of Speech Tagging", in Proc. AAAI-94.
 • Richard Sproat, Morphology and Computation, The MIT Press, 1992. Luvut 1 - 3.
 • K. Koskenniemi, "A Discovery Procedure for Two-Level Phonology", teoksesta L. Cignoni and C. Peters (editors), Computational Lexicology and Lexicography: A Special Issue Dedicated to Bernard Quemada, 1991, ss. 451-465
 • L. Karttunen, "Finite-State Constraints", julkaisussa Proceedings of International Conference on Current Issues in Computational Linguistics, Malaysia, 1991, ss. 23-40.
Kurssin laajuus opintoviikkoina:
2 ov
HY:n opintosuoritusrekisterin koodi:
490142-2

Opetus

Linkit:
Opettaja:
Lauri Carlson
Suoritustapa:
Joka kerralla on puheenaihe, johon osoitetaan etukäteisluettavaa. Luennoilla täydennetään luettua ja pyritään soveltamaan sitä käytäntöön. Loppukoe 26.4.
Paikka ja aika:
kl ke 9-12 S20 ls 334D, Carlson 15.3.-26.4.
Ilmoittautuminen:

Kurssimateriaali:
Laitoksella on materiaalikansio, jossa on kirjallisuudesta tarvittavien sivujen kopiot. Näistä voi kukin tehdä itselleen henkilökohtaiseen käyttöönsä kopion. Kansio sijaitsee laitoksella olevassa hyllykössä.