Kieliteknologian oppiaine

Monikielinen kieliteknologia, Ctl310mlt, kevät 2004

- KIT-verkosto | Yleisen kielitieteen laitos| Kieliteknologian opetus| Helsingin yliopisto -

Kurssin materiaalit

Kurssin idea:

Kirjan State of the Art in Human Language Technology on nyt noin kymmenvuotias. Sen luku 8 rajaa monikielisen kieliteknologian alan ja katsastaa alan tilanteen noin 90-luvun alkupuolelle mentäessä. Tällä kurssilla koetetaan päivittää katsaus eli ottaa selkoa, mitä edistystä jos mitään on tapahtunut viimeisen 10 vuoden aikana.

Voitaisiin tehdä niin että mlt:n eri osa-alueilla olisi "hoitaja", joka keräisi ao. alan uutuudet lähteistä ja muiden vihjeistä ja kirjoittaisi kurssin lopuksi katsauksen omaan alueeseensa. Kurssin aikana käytäisiin keskustelua ala per sessio.

Lähdetään liikkeelle helposta päästä, eli kielentunnistuksesta, jota aihetta voi myös laajentaa puheentunnistukseen, tekstityypin tunnistukseen ja käännöslaadun tunnistukseen (Jones/Rusk Colin 2000).

Aiheet ja hoitajat

  • Kielentunnistus
  • Monikieliset korpukset
  • Monikielinen terminologia/ontologia
  • Käännösmuistit/muistipohjainen konekäännös
  • Konekäännös
  • Monikielinen generointi
  • Monikielinen tiedonhaku
  • Monikielinen puheteknologia (jaetaanko eteenpäin?)

Moodle

Artikkeleita

  • Borin Coling 2000
  • Rusk/Jones Coling 2000