Yliopiston etusivulle Suomeksi
Helsingin yliopisto
clt140: Kieliteknologian johdanto ja harjoitukset - syksy 2005

Yhteystiedot:

Osoite:
Yleisen kielitieteen laitos
PL 9
Siltavuorenpenger 20A
00014 Helsingin yliopisto

Puhelin: +358 (09) 1911 (vaihde)
Faksi: +358 (09) 191 29307

Luettelo kurssin materiaaleista

Tälle sivulle on kerätty tietoja ja linkkejä kurssilla käytetystä ja käytettävästä materiaalista. Kullekin luentoviikolle on tehty erillinen sivunsa, johon on laitettu sitä viikoa koskevat linkit ja lukuohjeet.

Artikkelit ja kirjat, joista osia käytetään kurssilla

Kahta ensimmäistä seuraavista kirjoista (ja ehkä kolmattakin) tulisi löytyä kotiyliopistosi tai -laitoksesi kirjastosta. (Neljännestä ja viidennestä on olemassa julkisesti verkossa oleva kopio.)

  1. Ruslan Mitkov (ed.), The Oxford Handbook of Computational Linguistcs, Oxford University Press, 2003.
  2. Daniel Jurafsky and James H. Martin, Speech and Language Processing, Prentice Hall, NJ, 2000. (Kirjalla on myös kotisivu Internetissä)
  3. L. Rabiner and B-H. Juang, Fundamentals of Speech Recognition, Prentice-Hall, 1993.
  4. Sami Lemmetty, Review of Speech Synthesis Technology. MSc. Thesis. Laboratory of Acoustics and Audio Signal Processing, Helsinki University of Technology, Finland, 1999.
  5. Timo Lahtisen, Automatic indexing: an approach using an index term corpus and combining linguistic and statistical evidence, Helsinki, 2000.
  6. Michael F. McTear, Spoken Dialogue Technology: Towards the Conversational User Interface, Springer, 2004.

Kurssin moniste: Johdatus kieliteknologiaan

Moniste on verkossa luvuittain erillisinä tiedostoina. Kukin luku on erillisenä ja kolmeen muotoon talletettuna: (a) PS eli PostScript, jollainen on Linux-järjestelmissä helppo tulostaa paperille ja myös tarkka ja helppo selattavaksi, (b) PDF, joka voidaan tulostaa tarkkana ja jota voi katsella useimpien järjestelmien selaimella, sekä (c) HTML, jollaista voi selata kaikilla järjestelmillä, mutta jota ei kannata tulostaa paperille (koska edelliset kaksi tulostuvat siistimpinä). Kurssimonisteen luvut, jotka ilmaantuvat kurssin edetessä ajan tasalle muokattuna verkkoon (ja sitä ennen saattavat olla näkyvissä vanhoina versioina) ovat:

  1. Johdanto (© Kimmo Koskenniemi 2005) (PostScript, PDF ja HTML)
  2. Kirjoittajan apuvälineet (© Kimmo Koskenniemi 2004) (PostScript, PDF ja HTML)
  3. Tiedonhaku ja siihen liittyvät teemat (© Kimmo Koskenniemi 2004)
  4. Puheteknologia (© Kimmo Koskenniemi 2004)
  5. Vuorovaikutus koneiden kanssa luonnollisella kielellä (© Kimmo Koskenniemi 2004)
  6. Kielenoppimisen kieliteknologia (© Kimmo Koskenniemi 2004)
  7. Kielen kääntämisen kieliteknologia (© Kimmo Koskenniemi 2004)

Ajantasaisen version ilmaantumisesta ilmoitetaan aina kurssin kalenterin kautta. Älkää siis tulostako paperille edellisvuotista materiaalia.

Muistettakoon, että luentomoniste (kuten muutkin vastaavat materiaalit myös kurssin aiemmilta pitokerroilta) ovat tekijänoikeuden alaisia. Sitä saa lukea vapaasti ja siitä voi tehdä enintään muutamia kopioita henkilökohtaiseen käyttöönsä. Muuttaminen ja uudelleenjulkaisu ovat tietysti nimenomaisen luvan varassa.

Linkkejä kieliteknologian maailmaan

Ohessa linkkejä sivuille, joilta useilta löytyy linkkejä useisiin kieliteknologian kannalta mielenkiintoisiin paikkoihin:


Copyright: Kimmo Koskenniemi 2005, Kaikki oikeudet pidätetään.