Kieliteknologian oppiaine

Ctl142

- KIT-verkosto | Yleisen kielitieteen laitos| Kieliteknologian opetus| Helsingin yliopisto -
Kurssin sivut
Kurssin kalenteri
Kurssin materiaali
Luennoitsija
Kurssin kuvaus

KIT Ctl142, 2003k:
Automaattinen syntaktinen analyysi

Kurssikuvaus

Esitiedot:

  • Yleisen kielitieteen perustiedot, esim. yleisen kielitieteen peruskurssi Cyk110,
  • kieliteknologian perustiedot, esim. kieliteknologian johdantokurssi Ctl190 sekä
  • perustietoja syntaksista, esim. syntaksin harjoituskurssi Cyk140.

Tavoitteet:

  • Saada käsitys syntaksin ilmiöistä jäsennysongelmina.
  • Ymmärtää eräiden jäsennysmenetelmien toimintaperiaatteita.
  • Harjoitella kielten kuvaamista asianomaisilla menetelmillä.

Kurssin sisältö:

  • Sananmuotojen ratkonta (tagging)
  • Lausekkeiden tunnistus (chunking)
  • Pintajäsennys (surface parsing)
  • Syväjäsennys (deep parsing)

Kirjallisuus:

  • F. Karlsson, A. Voutilainen, J. Heikkilä, A. Anttila, (ed.) Constraint Grammar: A Language-Independent System for Parsing Unrestricted Text, Mouton de Gruyter, 1995, luvut 1-2
  • Yllä mainitusta kirjasta voi lukea myös luvut 3-6, mutta helpommin saa yleiskuvan englannin kieleen sovelletusta CG:stä laitoksen julkaisusta nro 21: Atro Voutilainen, Juha Heikkilä, Arto Anttila: Constraint Grammar of English: A Performance-Oriented Introduction, 1992. Tästä kirjasesta saa luennoitsijalta kuittausta vastaan kappaleen lainaksi kurssin ajaksi.
  • K. Koskenniemi, "Finite-state Parsing and Disambiguation", pp. 229-232, COLING-90.
  • E. Roche, Y. Schabes, (ed.), Finite-State Language Processing, MIT Press, 1997, luvut 8-10
  • Eric Brill, "Some Advances in Transformation-Based Part of Speech Tagging", in Proc. AAAI-94.
  • Richard Sproat, Morphology and Computation, The MIT Press, 1992. Luvut 1 - 3.
  • K. Koskenniemi, "A Discovery Procedure for Two-Level Phonology", teoksesta L. Cignoni and C. Peters (editors), Computational Lexicology and Lexicography: A Special Issue Dedicated to Bernard Quemada, 1991, ss. 451-465
  • L. Karttunen, "Finite-State Constraints", julkaisussa Proceedings of International Conference on Current Issues in Computational Linguistics, Malaysia, 1991, ss. 23-40.
Kurssin laajuus opintoviikkoina:
2 ov
HY:n opintosuoritusrekisterin koodi:
490142-2

Opetus

Linkit:
Opettaja:
Lauri Carlson
Suoritustapa:
Joka kerralla on puheenaihe, johon osoitetaan etukäteisluettavaa. Luennoilla täydennetään luettua ja pyritään soveltamaan sitä käytäntöön. Loppukoe 26.4.
Paikka ja aika:
kl ke 9-12 S20 ls 334D, Carlson 15.3.-26.4.
Ilmoittautuminen:

Kurssimateriaali:
Laitoksella on materiaalikansio, jossa on kirjallisuudesta tarvittavien sivujen kopiot. Näistä voi kukin tehdä itselleen henkilökohtaiseen käyttöönsä kopion. Kansio sijaitsee laitoksella olevassa hyllykössä.