Yliopiston etusivulle Suomeksi
Helsingin yliopisto
Ctl190: Kieliteknologian johdantokurssi - syksy 2004

Yhteystiedot:

Osoite:
Yleisen kielitieteen laitos
PL 9
Siltavuorenpenger 20A
00014 Helsingin yliopisto

Puhelin: +358 (09) 1911 (vaihde)
Faksi: +358 (09) 191 29307

Kurssin ydinainekset

Kurssilla opetettavat välttämättä osattavat asiat

Kieliteknologiasta yleensä

  • Mitä kieliteknologia (language technology, human language technology) ja sen ydinalue tietokonelingvistiikka (computational linguistics) suunnilleen ovat? Osattava perustella miksi kielen tunnistaminen ja tuottaminen ovat vaikeasti toteutettavia tehtäviä? Osattava tunnistaa kieliteknologian tärkeimmät sovellusalueet ja perustella kieliteknologian mahdollista merkitystä nykypäivän ja tulevaisuuden palvelujen ja sovellusten tekemisessä.
  • Tunnistettava luonnollisen kielen järjestelmän erilaisuus verrattuna esimerkiksi ohjelmointikieliin. Tunnistettava kielen luontainen monitulkintaisuus sen eri muodoissa ja osattava antaa siitä esimerkkejä (moniselitteisyys (ambiguity)). Tunnistettava kielen summittaisuus (merkitykset eivät ole tarkkarajaisia eivätkä täsmällisiä).
  • Erilaiset käsitteet, jotka vastaavat yleiskielen 'sanaa': hakusana (lexeme), sananmuoto (word-form) ja sane, sananmuodon esiintymä (word token); sanan alamerkitys (word sense)
  • Tunnistettava kielen järjestelmän laajuus ja mutkikkuus. Osattava esimerkein havainnollistaa ihmisen kielikyvyn olemassaoloa. (Osaamme käyttää kieltä, vaikka emme osaa selittää, miten se tapahtuu.) Tunnistettava puhutun ja kirjoitetun kielen yleisiä eroavuuksia pääpiirteittäin.
  • Kielen lausekerakenteen olemassaolo ja se, että eri kielet käyttävät eri keinoja lauserakenteiden ilmaisemiseksi (morfologisia ja sanojen ja lausekkeiden keskenäiseen järjestykseen perustuvia). Tunnistettava se, että kielen järjestelmä ei koodaa kaikkea merkityksestä ja osattava antaa siitä esimerkkejä.

Kirjoittajan apuvälineistä

Tiedonhausta

  • tiedonhaku, dokumentin tiivistäminen, dokumentin luokittelu, dokumentin indeksointi, saanti, tarkuus, relevanssi, hakuvartalo, typistäminen
  • kielen taipumisen vaikutus tiedonhaun saantiin; morfologisen analyysin vaikutus saantiin; hakutermin katkaisun vaikutus saantiin ja tarkkuuteen;

Puheteknologiasta

  • Käsitteenä §speech-recognition, §speech-synthesis, §spectrum, §spectrogram, §formant, §prosody,
  • Tunnistettava puheentunnistuksen ja puhesynteesin rajoituksia. Tunnettava puheentunnistuksen ja puhesynteesin tärkeimmät sovellusalueet.

Vuorovaikutuksesta ihmisen ja koneen välillä

  • Dialogi (dialogue), puheentunnistus (speech recognition), puhesynteesi (text-to-speech synthesis), äärellistilaiset dialogijärjestelmät (finite state -based dialogue system), (frame-based dialogue systems), agenttipohjaiset dialogijärjestelmät (agent based dialogue systems), arkitietämys (world knowledge), sovellusalueen tietämys (domain knowledge), käyttäjämalli (user model), tarkistaminen (verification), vahvistaminen (confirmation)

Kielenoppimisen kieliteknologiasta

  • Morfologinen jäsennin (morphological-parser); syntaktinen jäsennin (syntactic-parser); alamerkityksen yksiselitteistäminen (word-sense-disambiguation);
  • Konkordanssi; kaksikielinen korpus (bilingual-corpus); tekstien kodistaminen (text-alignment);
  • Tekstien valikointi kielenoppimista varten;

Kielen kääntämisen teknologiasta

  • Koneellinen kielenkääntö; tulkkaus; lokalisointi; termi; uudissana; monikielinen tiedonhaku; sanojen alamerkitysten erirakenteisuus eri kielissä; kielen käätämistä vaikeuttavat tekijät; termien tunnistaminen; terminologian hallinta; sähköinen sanakirja; automaattinen kielenkääntö; Konekäännöksen eri tavoitetasot; raakakäännös; käännösmuisti; interlingua; transfer;

Hae laitoksen sivuilta:

Yleisen kielitieteen laitos | Humanistinen tiedekunta | Helsingin yliopisto
Copyright © 2003-2004 Helsingin yliopisto. Kaikki oikeudet pidätetään.