KIT Ctl142
Automaattinen syntaktinen analyysi
Ctl142 (2 ov) 490142-2
2003 kl

Esitiedot

Tavoitteet

Ymmärtää syntaksin ilmiöitä kieliteknologian jäsennysmenetelmien kohteena. Ymmärtää eräiden syntaktisten analyysimenetelmien toimintaperiaatteita sekä luoda valmiuksia eri kielten kuvaamiseksi syntaktisen analyysin menetelmillä.

Kurssin sisältö

Kirjallisuus

Alkutentissä tentitään seuraavat kirjat ja artikkelit, jotka ovat saatavilla laitoksen luentosalin eteisessä olevassa hyllykössä. Kansiossa olevista irtolehtisistä versiosta voi kukin tehdä kopiokoneella itselleen ikioman kopion. Tenttiä varten tulisi lukea seuraavat:

  1. F. Karlsson, A. Voutilainen, J. Heikkilä, A. Anttila, (ed.) Constraint Grammar: A Language-Independent System for Parsing Unrestricted Text, Mouton de Gruyter, 1995. Yllä mainitusta kirjasta voi lukea myös luvut 3-6, mutta helpommin saa yleiskuvan englannin kieleen sovelletusta CG:stä laitoksen julkaisusta nro 21: Atro Voutilainen, Juha Heikkilä, Arto Anttila: Constraint Grammar of English: A Performance-Oriented Introduction, 1992. Tästä kirjasesta saa luennoitsijalta kuittausta vastaan kappaleen lainaksi kurssin ajaksi.
  2. K. Koskenniemi, "Finite-state Parsing and Disambiguation", pp. 229-232, COLING-90.
  3. E. Roche, Y. Schabes, (ed.), Finite-State Language Processing, MIT Press, 1997.
  4. Eric Brill, "Some Advances in Transformation-Based Part of Speech Tagging", in Proc. AAAI-94.

Opetus

Linkit
Opettaja
Lauri Carlson
Kurssin suoritustapa
Ennen kurssia luetaan kirjallisuus ja artikkelit, joista on tentti noin kolmannella viikolla kurssin alusta. Luennoilla täydennetään luettua ja pyritään operationalisoimaan luettu tieto. Kurssin jälkeen kirjoitetaan luennoitsijan kanssa sovitusta aiheesta lyhyt essee.
Paikka ja aika
kl to 12-14 ja pe 11-15 Sv20 ls 334D, Carlson, 4.4.-19.4.
Ilmoittautuminen kurssille
Alkutenttiin ja samalla kurssille ilmoittaudutaan S-postitse luennoitsijalle. Ilmottautumisviesti mieluusti seuraavanmuotoinen:
viestin otsikkona (Subject:) Ilmoittaudun kurssille Ctl142
Viestin sisältönä: Sukunimi,Etunimi,tunnus,01234567
missä tunnus on laitoksemme koneilla oleva enintään 8-merkkinen käyttäjätunnus tai sen puuttuessa kokonainen sähköpostiosoite, ja 01234567 ilmoittautujan opiskelijanumero HY:ssa.
Kurssimateriaali
Kurssilaisten käytössä on materiaalikansio, jossa on kirjallisuudesta tarvittavien sivujen kopiot. Näistä voi kukin tehdä itselleen henkilökohtaiseen käyttöönsä kopion. Kansio sijaitsee laitoksella, Unix-luokkaa vastapäätä olevassa hyllykössä.
Luentomuistiinpanot
  1. Luento 1
  2. Luento 2
  3. Loppuesseen aiheita


Päivitetty: Monday, 19-May-2003 10:32:16 EEST lauri.carlson@helsinki.fi