Kieliteknologian sovellus- ja erikoistumisalueita

Huomattava osa kieliteknologian erikoistumiskursseista tulee tarjottavaksi muotoutumassa olevan opetuksen verkoston puitteissa useiden oppiaineiden ja korkeakoulujen välisenä yhteistyönä.

Tiedon haku ja hallinta

Elämme tunnetusti tiedon tulvan keskellä. Kriittistä ei ole enää tekninen pääsy tietoihin, vaan pikeminkin mahdollisuus löytää ja valikoida merkityksellistä tietoa, luokitella sekä tiivistää ihmiskielen muodossa olevaa kirjoitettua tietoa. Näiden tehtävien ratkaisemiseksi käytetään toisaalta tilastomatemaattisia ja toisaalta kieliteknologisia menetelmiä.

Sopivia kursseja oman oppianeen lisäksi tilastotieteestä, todennäköisyyslaskennasta sekä informaationtutkimuksesta (Tampereen yliopistosta).

Puheteknologia

Puheen käyttäminen tietokoneen kanssa kommunikoitaessa nousee yhä tärkeämmäksi, koska tämä on monissa tilanteissa ainoa luonteva tapa kommunikoida tietojärjestelmien kanssa kännykäntapaisten laitteiden avulla. Puheteknologia sisältää sekä automaattisen puheentunnistuksen että puhesynteesin menetelmät. Aihepiiri on monitieteinen: se koskettelee puheen tuottamista ja kuulemista (fonetiikkaa), puhutun kielen rakennetta (kieliteknologiaa, yleistä kielitiedettä) sekä digitaalista signaalinkäsittelyä. Se vuoksi opetus tapahtuukin yhteistyönä tiedekuntamme eri laitosten ja Teknillisen korkeakoulun kesken.

Luonnollisen kielen käyttöliittymä

Ihminen kommunikoi yhä useammin tietokoneiden ja tietojärjestelmien kanssa suoraan esimerkiksi puheen tai sanallisesti annettujen viestien välityksellä. Tietokoneen ja ihmisen rooli tällaisessa keskustelussa täytyy mallintaa ja toisaalta koneen tulee osata tuottaa kieltä ja tunnistaa ihmisen antamia komentoja, vastauksia ja kysymyksiä.

Sopivia kursseja on toisaalta tietojenkäsittelyn puolella (tietokoneen käyttöliittymistä), kognitiivisessa teknologiassa, psykologiassa ja kognitiotieteessä (koneen ja ihmisen toiminnan mallintamisesta), joissakin kieliaineissa (dialogin tutkimuksesta) jne.

Neuraalilaskenta

Neuraalilaskentaan kuuluu koko joukko menetelmiä, joita voidaan soveltaa myös kielen rakenteen tunnistamiseen esim. osana puheteknologiaa, dokumenttien luokitteluun ja organisointiin, sekä kielen tunnistuksen ja tuottamisen mallintamiseen. Neuroverkkojen opetusta omassa tiedekunnassamme mm. kognitiotieteessä ja Teknillisessä korkeakoulussa tietotekniikassa.

Tietokoneavusteinen kielenoppiminen

Tietokone voi nykyään toimia paitsi kirjan korvikkeena, myös nauhurina, diaprojektorina tai sillä voidaan näyttää liikkuvaa kuvaa. Tämä ei sinänsä tee kielenopetusohjelmista kielteknologisia sovelluksia, vaan se, että kielen sääntöjä ja toimintaa voidaan jäljitellä kieliteknologian kehittämillä malleilla, jolloin oppilas voi saada ymmärtävää ja oikeaan suuntaan ohjaavaa palautetta, esim. tekemistään virheistä.

Sopivia kursseja on oman oppiaineen lisäksi tietotekniikan puolella (multimedia ym.), soveltavassa kielitieteessä (Jyväskylässä), ym.

Kielenkääntämisen apuvälineet

Kielenkääntäminen on erityisesti Euroopassa laajaa, esim. tiettävästi EU:n hallinnon suurin yksittäinen menoerä. Kieliteknologialla voidaan käännöstyötä toisaalta helpottaa ja nopeuttaa ja toisaalta käännöstyön tulosta parantaa. Apuvälineinä voidaan käyttää elektronisia sanakirjoja sekä välineitä kunkin erikoisalan terminologian keräämiseksi ja hallitsemiseksi. Joskus kehitetään erityisiä kontrolloituja versioita luonnollisista kielistä, joiden kääntäminen on yksinkertaisempaa. Osin käytetään myös automaattisia kielenkääntöohjelmia, joiden tuloksen ihmiskääntäjä korjailee ja viimeistelee.

Sopivia kursseja on oman oppiaineen lisäksi käännöstieteessä.

Kirjoittajan apuvälineet

Kieliteknologian avulla tuotetaan erilaisia kirjoittajan apuvälineitä, kuten oikeinkirjoituksen tarkistusohjelmia, synonyymisanastoja, ja kielenhuolto-ohjelmia. Näiden toteuttamisessa tietokoneella saatetaan tarvita kielen kuvaamisen ja sanastojen lisäksi edistyneitä tietojenkäsittelytieteen menetelmiä, automaattien teoriaa ym.

Kielen kuvaamisen mallit

Kieliteknologian ytimenä ovat erilaiset jäsennysmenetelmät ja tavat esittää kieltä ja sen rakennetta tietokoneen muodossa. Opiskelijat voivat erikoistua tähän erityisesti tutkimukseen suuntautuvaan vaihtoehtoon, jossa haasteena on myös kehittää entistä parempia kielenkäsittelymenetelmiä. Tähän tarvitaan toisaalta kunnollista ymmärrystä itse kielen olemuksesta mutta samalla myös tietojenkäsittelytieteen puolelta tietoa erilaisista teorioista, automaateista, algoritmeista ja tiedon esitystavoista.

Sopivia kursseja on oman oppiaineen lisäksi toisaalta yleisessä kielitieteessä ja toisaalta tietojenkäsittelytieteessä.

Sivu viimeksi päivitetty 12.5.1999
kimmo.koskenniemi@helsinki.fi