Kieliteknologian seminaari Ctl330
lukuvuonna 2002-2003

Opinto-oppaan teksti: sl+kl ke 14-16 S20 lait.sh, Koskenniemi alkaa 18.9.

Seminaari pyrkii palvelemaan rakenteilla olevaa valtakunnallista kieliteknologian opetuksen verkostoa siten, että sekä kuulijoiksi että puhujiksi toivotaan verkoston kaikista laitoksista opiskelijoita ja tutkijoita. Seminaarissa esiintyvät myös kieliteknologian gradun, väitöskirjan tai muun laajemman työn tekijät esittelemällä suunnitelmiaan tai tekemiään töitään, mutta toisaalta myös eri vaiheissa olevia opiskelijoita tai tutkijoita epämuodollisemmin saadakseen esim. palautetta ajatuksistaan ja vinkkejä jatkoa varten.

Aikomuksesta esiintyä seminaarissa kannattaa ottaa mahdollisimman varhaisessa vaiheessa yhteyttä seminaarin ohjaajaan, Kimmo Koskenniemeen, (s-posti: etunimi.sukunimi@helsinki.fi)

Seminaarin istunnot pidetään yleisen kielitieteen laitoksella Siltavuorenpenger 20 A, kolmannessa kerroksessa, laitoksen seminaarihuoneessa 331 ellei toisin mainita. Käynti yleisen kielitieteen laitokselle on toistaiseksi Siltavuorenpenkereen rakennustöiden takia mutkikkaampi kuin ennen. Nykyään on helpointa tulla sinivihreän rakennuksen itäseinustalta rappuun, jonka kolmannesta kerroksesta pääsee melko suoraan perille. Itäseinustalle pääsee, kun Snellmanninkadulta tultaessa lähtee kiertämään rakennusta vastapäivään. Opasteitakin on.

Esitys kestää normaalisti 14.15 - 15.30 ja esityksen jälkeen varataan 15 minuuttia keskusteluun. Huoneessa on piirtoheitin. Tarvittaessa paikalle järjestetään videoprojektori, johon voi liittää esim. oman kannetavan tietokoneensa. Projektorin voi varata etukäteen rakennuksen vahtimestarilta ja projektorin toimiminen yhdessä koneensa kanssa on syytä varmistaa ennen seminaarin alkua. Seminaarihuoneessa on verkkoyhteys, johon kannettavan tietokoneensa voi liittää.

Syyslukukausi 2002

pe 16.8.2002 klo 13.15 - 14
Graeme Hirst, (Department of Computer Science, University of Toronto), Measures of Semantic Relatedness and the Detection and Correction of Real-Word Spelling Errors.

Abstract: Lexical semantic relatedness in text reflects cohesion in the text. Lexical semantic relationships include synonymy, hypernymy, and meronymy. But what degree of closeness by such links counts as semantic relatedness and how it can be measured? We experimentally compared five different proposed measures of similarity or semantic relatedness in WordNet by examining their performance in a real-word spelling correction system. We will discuss what these results mean for applications in NLP, and also outline a method of real-word spelling correction that approaches practical usefulness

ke 18.9. klo 14-16
Seminaarin aloitus ja syksyn ohjelmasta sopiminen.
ke 25.9.
(Ei istuntoa.)
ke 2.10.
Dos. Graham Wilcock, XML-based Natural Language Generation
ke 9.10.
Nicholas Volk, Tekstin rikastaminen suomenkielistä puhesynteesiä varten
Puhesynteesiin voi tutustua demon avulla. Kannattaa myös tutustua johonkin synteesimerkintäkieleen, esim. SSML:ään.
ke 16.10.
(Ei istuntoa.)
ke 23.10.
(ehkä ei istuntoa?)
ke 30.10.
ke 6.11.
(Ei istuntoa, Soinisen esitys siirtynyt viikoa myöhemmäksi.)
ke 13.11.
Mirkka Soininen, Tekstin rakenteen tunnistaminen. Ks. laajempi yhteenveto esitelmän teemasta sekä aiemmin pidetystä yleisen kielitieteen seminaariesitelmästä.
ke 20.11.
Jyrki Niemi, Aikailmauksien lokalisointi
ke 27.11.
Heikki Kantola, Termien tunnistus ja sen käyttökohteita
ke 4.12.
Sinikka Loikkanen, Keksimismenetelmät (Discovery Procedures).

Kevätlukukausi 2003

Keväälle 2003 jäivät Sirke Viitasen tiedon eristämiseen ja Topi Junkkarin käännösmuisteihin ja sumeaan hakuun liittyvät esitelmät.

22.1.2003
(ei istuntoa)
29.1.
(ei istuntoa)
5.2.
(ei istuntoa)
12.2.
(ei istuntoa)
19.2.
(ei istuntoa)
26.2.
(ei istuntoa)
5.3.
(ei istuntoa)
ke 12.3.
Jukka-Pekka Onnela (TKK), Kielen sanaston taksonomiasta. (Tutkimusasetelman esittelyä keskustelua varten.)
ke 19.3.
(Piti olla, mutta peruuntui:) Sjur Moshagen, Government Phonology - the acoustic-linguistic interface.
Government Phonology belongs to a group of phonological theories that have made a radical departure from the SPE(1) inspired, feature theories that is still dominating phological research. The constituent structures are controlled using government relationships, and principles and parameters (thus the name, after the Government & Binding theory of syntac), whereas the constituents are made of primitives that themselves can be constituents, and each of which can be thought of as acoustic "images". These primitives (and the corresponding "images") can be combined (or "overlaid") to form complex constituents.
The presentation will give a brief introduction to the main features of this theory, focusing on the acoustic-phonology (and hence linguistic) interface. At the end I will briefly touch upon how this (and similar) theories can be the starting point for a reintroduction of phonology into speech recognition. Interested persons can read: Harris, John and Geoff Lindsey (2000): Vowel patterns in mind and sound. In Noel Burton-Roberts, Philip Carr & Gerry Docherty (eds.), Phonological knowledge: conceptual and empirical issues, 185-205. Oxford University Press. The paper can be found at the following URL: http://www.phon.ucl.ac.uk/home/johnh/Newky48.pdf (the referenced table and figures, as well as the notes can be found at the end of the paper) (1) Chomsky, Noam and Morris Halle (1968): The Sound Patterns of English"
ke 26.3.
Anssi Yli-Jyrä, Onko englanninkielen syntaktinen FSIG-kuvaus tähdetön? Ks. aiheeseen liittyvä EACL-esitelmä
2.4.
(ei istuntoa)
9.4.
(ei istuntoa)
16.4.
Jussi Piitulainen, Moniselitteisten sanojen jakaumallinen samanlaisuus
23.4.
(PERUUTETTU, SIIRTYY MYÖHEMMIN ILMOITETTAVAAN AJANKOHTAAN: Antti Arppe: Monimenetelmällinen (empiirinen) kielentutkimus käytännössä. Ohessa esitelmän kalvot PDF-muotoisina (joita kaikkien pitäisi voida selata helposti) ja PostScript-muotoisina, joita Linuxin ja Unixin käyttäjät voivat vielä helpommin selata.)
7.5.
Sirke Viitanen, Tiedon eristäminen ja nimien variointi dokumenteissa.

Linkkejä