Kieliteknologia on ihmisten kieleen kohdistuvaa tai sitä hyväksikäyttävää teknologiaa mukaan lukien teoriat, joihin se perustuu. Kieliteknologia on tutkimuksen, korkeakouluopetuksen ja teollisen toiminnan kohteena verraten uusi, laaja-alainen ja rajoiltaan epätarkka alue. Siitä ja sen erinäisistä osa-alueista on käytetty ja käytetään edelleen erilaisia muitakin nimiä, kuten tietokonelingvistiikka (engl. computational linguistics , ruotsiksi datalingvistik tai datorlingvistik ), luonnollisen kielen käsittely (engl. natural language processing, NLP ) tai matemaattinen kielitiede ja usein osia siitä on sisällytetty esimerkiksi tekoälyn tutkimukseen. Euroopan yhteisö on tutkimusohjelmissaan käyttänyt alasta esim. englanninkielisiä nimityksiä Language Research and Engineering (LRE) , Language Engineering , ja käyttää nykyään nimitystä Human Language Technology . Kielitieteellinen tietojenkäsittely (linguistic computing) on myös läheisessä suhteessa kieliteknologiaan.
Tekesin rahoittama esiselvityshanke on julkaissut vuonna 1998 raportin Kieliteknologia Suomessa , toim. Manne Miettinen, CSC Raportti R02/98, joka selvittää kieliteknologian nykytilaa ja mahdollisuuksia Suomessa sekä tutkimuksen että yritystoiminnan kannalta. Tämä raportti on varsin hyödyllinen lähde arvioitaessa minkälaisia asioita kieliteknologiaan kuuluu.
Kieliteknologian tehtävää voi hahmotella luonnollisten kielten automaattisen käsittelyn teorian ja menetelmien (tietokonelingvistiikan) sovelluskohteiden kautta. Tällöin voidaan nimetä esim. seuraavia aihepiirejä, joista monet tunnetaan myös muiden oppiaineiden tai niiden haarojen osina tai sovelluskohteina (näitä on mainittu suluissa):
Kaikki kieleen liittyvät sovellukset eivät kuitenkaan ole keskeistä kieliteknologiaa. Esimerkiksi tekstinkäsittelyssä käyttäjä kirjoittaa kieltä, jota ohjelma myös käsittelee ja tallettaa, ilman että tekstinkäsittelyohjelmaa pitäisi tämän vuoksi pitää kieliteknologisena sovelluksena. Esimerkiksi oikeakielisyyden tarkistustoiminto, joka mallintaa kieliopin ja sanakirjojen tietoja , on vasta varsinaista kieliteknologiaa. Myös kielenopiskeluohjelma voi olla olennaisilta osiltaan kuten ääni- ja videonauhuri sekä piirtoheitin, ilman varsinaista toimivaa tietoa tai mallia kielen rakenteesta. Kieliteknologiseksi tällainen sovellus muuttuu, kun ohjelmaan liitetään tietoa kielen toiminnasta ja rakenteesta, jolloin ohjelma voi neuvoa oppilasta oikeaan suuntaan.
Termillä tietokonelingvistiikka on usein korostettu
kieliteknologian tutkimusluonnetta,
jolloin haasteena on kuvata ihmisen (yleensä
kirjoitetussa muodossa olevan) kielen rakennetta ja toimintaa
tietojenkäsittelytieteen ja matematiikan malleilla ja menetelmillä.
Tavoite on silloin lähellä yleisen kielitieteen tavoitteita, mutta
menetelmät ja teoriat ovat toisenlaisia, koska niiltä vaaditaan
tietokoneen edellyttämää eksplisiittisyyttä ja konkreettisuutta.
Erilaiset tällaisen tutkimuksen piirissä syntyneet
kielenkäsittelyn mallit, kuten sananmuotojen, lauserakenteiden
ja merkitysten jäsentämisen menetelmät muodostavat edelleen
kieliteknologian ytimen .
Ihmisen ja tietokoneen vuorovaikutus on olennainen osa tietotekniikkaa ja siinä kieliteknologia on mukana monella tasolla: sekä ihmisen vuorosanojen tulkitsemisessa, että tietojärjestelmän vastausten muuntamisessa ihmisten kielelle. Sekä puheen että tekstin muotoisen kielen analysoinnin laatu nousee tärkeäksi rajoittavaksi tekijäksi monissa järjestelmissä. Koneen ja ihmisen onnistunut dialogi ja järjestelmien hyvä käytettävyys edellyttää monipuolista kielen ja dialogin toiminnan ymmärrystä.
Puheteknologia on noussut erääksi informaatiotekniikan keskeisistä alueista ja on myös esimerkki aidosti monitieteisestä alasta. Tämän selvityksen yhteydessä voidaan puheteknologiaa pitää eräänä kieliteknologian tärkeimmistä alueista, kun puhetta tarkastellaan kielenä. Puheteknologian osia, jotka liittyvät läheisesti esimerkiksi tietoliikennetekniikkaan (kuten puheenkoodaus ja siistaus) jää kuitenkin kieliteknologian ulkopuolelle.
Organisaatioiden tiedon hallinnasta ja ihmisten välisestä viestinnästä
merkittävä osa tapahtuu digitaalisten dokumenttien välityksellä.
Suurin osa dokumentteihin sisältyvästä tiedosta on tallennettu
luonnollisten kielien avulla, useimmiten tekstinä, mutta äänen osuus
on kasvussa. Tiedonhaku tai haluttua tietoa sisältävien
dokumenttien etsintä on tärkeä osa monia normaaleja tehtäviä.
Tietomäärien kasvaessa automaattinen tekstin tiivistäminen,
dokumenttien luokittelu, indeksointi, suodatus ja
reititys
tulevat yhä keskeisemmiksi ja tarpeellisemmiksi.
Näiden tehtävien ratkaisemiseksi on käytetty toisaalta
kieliteknologisia menetelmiä, toisaalta (varsinkin englannin kielen
kohdalla) puhtaasti tilastollisia menetelmiä ja usein molemmanlaisia
menetelmiä yhdessä. Informaatiotutkimuksen ja kieliteknologian
suhteen tässä esiintyy samanlaista yhteistä aluetta kuin
puheteknologiassakin tietoliikennetekniikan ja kieliteknologian
välillä.
Kieliteknologia liittyy rakenteisiin dokumentteihin ja multimediaan usealla tavalla. Rakenteiset dokumentit voivat sisältää tekstiä, kuvaa, ääntä tai linkkejä toisiin dokumentteihin. Niiltä osin, kun rakenteinen dokumentti sisältää kieltä, voidaan kieliteknologian menetelmillä tuottaa esimerkiksi linkkejä, metatietoa dokumentin luokittelemiseksi tai löytymisen helpottamiseksi. Toisaalta myös rakenteisen dokumentin keinoin voidaan kieliteknologian menetelmillä löydettyä kielellistä rakennetta (esim. sanojen perusmuotoja, avainsanoja tai termejä) helposti merkitä myöhempää hyödyntämistä varten.
Kielenoppimisen ja -opettamisen teknologia on hyvin monitieteinen teema, joka koskettaa lähitulevaisuudessa mahdollisesti hyvin suuria ihmismääriä, mm. koska Euroopan unioni on poliittisestikin sitoutunut monikielisyyteen. Oppimateriaalin valmistamisessa, aktiivisen kielenkäytön harjoitteluvälineissä (elektronisissa työkirjoissa, kielenoppimispeleissä, ym.) voidaan enenevässä määrin hyödyntää kieliteknologiaa.
Tietokoneen ja kieliteknologian mukanaolon vuoksi itse luonnolliseen kieleen ja siihen, miten sitä käytämme, kohdistuu uutta mielenkiintoa. Esim. terminologiset työkalut auttavat ihmistä kirjoittamaan yksiselitteisempää tekstiä ja dialogin tutkimuksen menetelmät auttaisivat tekemään tietokoneohjelmien viestejä ihmiselle helpommin ymmärrettäviksi. Yksinkertaistetut, ns. kontrolloidut (luonnolliset) kielet ansaitsisivat itsessään lisää tutkimusta, koska niiden avulla voidaan joissakin tapauksissa päästä toimivampaan koneen ja ihmisen väliseen kommunikaatioon ja mm. monikielisiin sovelluksiin.
Pohjoismaissa kieliteknologia (tietokonelingvistiikka) esiintyy omana oppiaineenaan mm. Tukholman yliopistossa (datorlingvistik), Uppsalan yliopistossa (språkteknologiprogrammet, mutta jatkokoulutus nimellä datorlingvistik), Göteborgin yliopistossa (datalingvistik), Bergenin yliopistoissa (datalingvistikk) ja Syddansk universitetissa (sproglig informatik). Monessa korkeakoulussa on yleisen kielitieteen tai muun aineen yhteydessä (ilmeisesti resursseiltaan vaatimattomampi) kieliteknologian koulutusohjelma kuten Oslon yliopistossa (språk, logikk og informasjon, språkinformatik), Linköpingin yliopistossa tietotekniikan yhteydessä (språkinformatik). Oppiaine (datalingvistikk) ja vastaava oppituoli löytyy myös Norges teknisk-naturvitenskapelige universitetista (NTNU) Trondheimista. Puheteknologiaa opetetaan useissa pohjoismaisissa teknillisissä korkeakouluissa (esim. Kungliga Tekniska Högskolan, NTNU) ja se liittyy usein tietoliikennetekniikkaan tai digitaaliseen signaalinkäsittelyyn (näitä ei ole sisällytetty seuraavaan arvioon).
Vuoden 1998 syksyllä suoritetun (epävirallisen) kyselyn perusteella
saatiin arvio eri pohjoismaiden kieliteknologian alueen
korkeakouluopetuksen laajuudesta, joka on tiivistetty oheiseen kuvassa
1.1 olevaan taulukkoon:
![]() |
Saksassa kieliteknologian opetusta on toisaalta omalla nimellään (Computerlinvistik), mutta suurin osa opetuksesta sijainnee tietotekniikan tai tekoälyn osana. Saksassa on panostettu voimakkaasti kieliteknologian tutkimusohjelmiin. Näistä merkittävin on Verbmobil-niminen suurhanke, joka on useampivaiheinen ja yhteensä lähes 1000 henkilötyövuoden laajuinen, jossa suuret teollisuusyritykset ovat olleet myös mukana.
Belgiassa toimii Lernout & Hauspie -niminen kieliteknologian alalla huomattavan kokoinen yritys, jonka liikevaihto vuonna 1998 oli noin 211 miljoonaa USD, ja jolla oli noin 1700 työntekijää. Yritys kehittää kaikenlaista kieli- ja puheteknologiaa, mutta toistaiseksi huomattava osa toiminnasta on tavanomaisempaa, esim. kielenkääntämisen palvelua. Belgian valtio on tukenut L&H:ta ja muita Flanders Language Valleyn yrityksiä ja tutkimuslaitoksia merkittävillä summilla.
Monet telealan yritykset, erityisesti laitevalmistajat (esim. Nokia, Ericsson, Siemens) mutta myös operaattorit (esim. Sonera, Telia) ovat jo usean vuoden ajan kehittäneet erityisesti matkapuhelinviestintään liittyvää puheteknologiaa. Tämä työ on kohdistunut varsinkin puheenkoodaukseen ja -tunnistukseen. Näiden yritysten tuotekehitysyksiköissä työskentelee tällä hetkellä useita satoja puheteknologiaan erikoistuneita suunnittelijoita.
Euroopan unioni on panostanut melko runsaasti lähes kahdenkymmenen vuoden aikana erilaisiin kieliteknologian tutkimus- ja kehitysohjelmiin. Nyt käynnistyneeseen 5. puiteohjelmaan sisältyy informaatioyhteiskunnan teknologia -niminen osa, johon sisältyy multimedian sisällön ja työkalujen osa, jonka näkyvänä komponenttina on ''Human Language Technology'' eli kieliteknologia.
Suomen korkeakoululaitoksessa on tarjolla melko runsaasti kieliteknologiaan läheisesti liittyvää tai kieliteknologian ammattilaiseksi valmistuville hyödyllistä opetusta tietotekniikan, informaatiotutkimuksen, multimedian, yleisen ja soveltavan kielitieteen, kääntämisen, fonetiikan, viestinnän, digitaalisen signaalinkäsittelyn ym. alueilla. Nykytilanteessa on kuitenkin varsinaisten kieliteknologian ammattilaisten koulutukseen suunnattuna opetuksen tarjontaa kovin harvoille, lähinnä Helsingin yliopiston (HY) yleisen kielitieteen laitoksella, jossa voi suorittaa alan syventävät opinnot ja jatko-opintojakin. Puheteknologian opetusta Teknillisessä korkeakoulussa (TKK) ja Tampereen teknillisessä korkeakoulussa (TTKK) voi myös pitää alalle suuntautuneina. Suomen yliopistoissa tarjotaan kuitenkin hyvin laajalti kieliteknologiaan läheisesti liittyvää opetusta, jota voidaan osittain hyödyntää kieliteknologeja koulutettaessa.
Suomalaisen kieliteknologian vahvuuksina voidaan pitää toisaalta laadukasta alan tutkimusta, jo käynnistynyttä kaupallisesti lupaavaa kieliteknologian yritystoimintaa, sekä maan hyvin vahvaa ja vakiintunutta monikielisyyttä ja vieraiden kielten opetusta sekä tietotekniikan korkeata tasoa. Tutkimuksen ja sen myötä tulleiden kansainvälisten yhteyksien varaan on hyvä rakentaa yliopisto-opetusta. Yritystoiminta motivoi opiskelijoita hakeutumaan alalle ja helpottaa esim. opetusta tukevien kieliteknologisten hankkeiden saamista yliopistomaailmaan.
Nykytilanteen heikkoutena voidaan nähdä kieliteknologian kouluttajien niukkuus, tutkimusyhteisön ja opetusta antavien ryhmien hajanaisuus sekä toisaalta se, että jo käsitteenä kieliteknologia on edelleen verraten vähän tunnettu. Kouluttajien määrän rajallisuus lähtötilanteessa rajoittaa alussa osaltaan opetuksen kasvamista ja samanaikaisesti käynnistettävien erilaisten toimintojen määrää. Alueellinen hajanaisuus asettaa omia vaatimuksiaan yhteistyölle. Alan tuntemattomuus vähentää opiskelijoiden hakeutumista kieliteknologian piiriin.
Kieliteknologian yliopisto-opetuksen kehittämisen ja voimavarojen yhdistämisen avulla on kuitenkin mahdollista kehittää kansallista kieliteknologiaan perustuvaa ja sitä hyödyntävää tietotekniikan teollisuutta kansainvälisesti kilpailukykyiseksi ja ennen kaikkea laajuudeltaan merkittäväksi. Esimerkiksi Tekes on juuri käynnistämällään USIX-nimisellä kansallisella teknologiaohjelmalla osoittanut tukevansa kieliteknologian tutkimus- ja kehitystyötä tällaisilla tavoitteilla. Riittävillä kieliteknologian panostuksilla voidaan myös turvata kansallisten kulttuuriarvojen ja kielten säilymistä sekä osaltaan edistää kansainvälistymistä, jossa oma ja vieraat kulttuurit ovat tasapainoisesti tukemassa toisiaan.
Kieliteknologian yliopisto-opetuksen jääminen nykytasolle haittaisi ja hidastaisi kotimaisilla kielillä toimivien tietokoneiden käyttöliittymien kehittymistä ja saataville tuloa. Osaltaan tämä voisi johtaa myös ikääntyvien, vammaisten ja vähemmän koulutettujen kansalaisten elämänlaadun heikkenemiseen ja syrjäytymiseen tietoyhteiskunnasta, ellei teletekniikan ja tietoverkkojen palveluja saada toteutetuksi myös kotimaisille kielille. Jo nyt yleisesti tarvittavat palvelut edellyttävät yhä enemmän tietoteknistä koulutusta ja ilman asianmukaista kieliteknologiaa tilanne voi pahentua. Kieliteknologian ammattilaisten niukkuus voi myös haitata vähemmistökielten (esim. saamen, romanin ja viittomakielen) asemaa, ellei näiden kaupallisesti kannattamattomien kielten kieliteknologialle riitä tekijöitä.
Kieliteknologian yleistietoja tarvitaan toisaalta laajalti, mutta toisaalta eriasteisesti. Yhä useammalla alalla valmistuvien ammattilaisten olisi hyvä olla selvillä kieleen ja sen käsittelemiseen liittyvistä ongelmista sekä siitä, mitä kieliteknologian menetelmillä pääpiirteittäin voidaan tehdä. Tällainen yleistuntemus on enenevässä määrin tarpeen oman alan oikeiden työtapojen ja välineiden valinnassa.
Monet eri alojen ammattilaiset osallistuvat kieliteknologiaa soveltavien järjestelmien tai tuotteiden rakentamiseen ja tarvitsevat olennaisesti laajempia tietoja kieliteknologiasta, esim. sivuaineena perus- ja ehkä aineopinnot. Heidän tulee pystyä toisaalta tuottamaan sisältöä järjestelmiin, osallistumaan järjestelmien suunnitteluun ja esimerkiksi täsmentämään järjestelmän tulevien käyttäjien vaatimuksia (user requirements) toteutettavalle järjestelmälle. Heidän tehtävänään on myös kehittää omalla sovellusalallaan olevia kieliteknologiaa hyödyntäviä menetelmiä.
Eniten kieliteknologian tietoja tarvitsevat toki ne kieliteknologian ammattilaiset, jotka toteuttavat uusia menetelmiä tai järjestelmiä--saati sitten ne, jotka tutkijoina pyrkivät kehittämään uusia ja entistä parempia kieliteknologian menetelmiä. Nämä ammattilaiset ottavat kieliteknologian pääaineekseen ja mielellään sopivan sovellusalan sivuaineekseen.
Kieliteknologiaa voidaan soveltaa useisiin erityyppisiin tehtäviin. Seuraavassa hahmotellaan tärkeimpiä tällaisia ja kullakin alueella tarvittavaa korkeakouluopetusta. Useilla näistä aloista voidaan tunnistaa kuvan 4.1 pyramidimainen asetelma, jossa alhaalla laajemmille piireille tulisi tarjota yleistietoja kieliteknologiasta, jotta nämä voisivat hyödyntää omassa työssään erilaisia kieliteknologisia välineitä tai valmiita tuotteita. Ylhäällä pyramidissa on pienempi joukko kieliteknologiaan erikoistuneita ammattilaisia, jotka pystyvät tekemään näitä sovelluksia ja kehittämään menetelmiä. Keskivaiheilla voi olla mm. tulevia eriasteisia sisällön tuottajia tällaisiin sovelluksiin sekä alansa kehittäjiä menetelmille, jotka hyödyntävät kieliteknologisia välineitä.
Kieliteknologia oli aluksi voittopuolisesti pitkän tähtäyksen tutkimusta, jota yliopistot, Euroopan unioni ja eräät suuryritykset kuten Xerox, IBM ja ATT harjoittivat. Muutos käytännössä merkittäväksi ja monilla aloilla arkisissa asioissa tärkeäksi teknologiaksi on itse asiassa jo tapahtunut. Nyt on meneillään nopean kasvun ja haltuunoton vaihe. Erilaisten verkkopalvelujen ja sisällöntuotannon alueella kyky omaksua kieliteknologian uudet menetelmät voi olla olennainen osa markkinoita vallattaessa tai niillä kilpailtaessa.
Kieliteknologian ensimmäiset sovellukset ovat jo lähes jokaisen tekstinkäsittelyä harrastavan kansalaisen työpöydällä oikeinkirjoituksen tarkistus- ja tavutusalgoritmeina. Menetelmät valtaavat nopeasti uusia alueita, jotka koskettavat pian väestön kaikkia kerroksia. Niitä palveluita, joissa kieliteknologian avulla voidaan päästä olennaisesti parempiin tuloksiin, on runsaasti: kielten opiskelu, digitaaliset kirjastot, sähköinen kaupankäynti, kansalaisten opastaminen erilaisissa yhteiskunnan palveluissa, avoin pääsy tietoyhteiskunnan tietoihin jne.
Puheteknologian kehittyminen on ollut voimakasta viimeisten 15 vuoden aikana. Kehityksen on aiheuttanut digitaalisessa tietoliikennetekniikassa tapahtunut räjähdysmäinen kasvu, joka erityisesti matkapuhelinviestinnässä on tehnyt mahdolliseksi uusien puheteknologian menetelmien laajamuotoisen kaupallisen hyödyntämisen. Tämä kehitys tulee entisestäänkin voimistumaan lähivuosina, jota todistaa esimerkiksi se, että matkaviestinnässä tulee tapahtumaan merkittävä sukupolven vaihdos, kun nykyisestä GSM-järjestelmästä siirrytään seuraavaan vaiheeseen, UMTS:ään (Universal Mobile Telephone System). Kieliteknologian kannalta erittäin merkittävää on se, että tulevat tietoliikennejärjestelmät tulevat mahdollistamaan laajakaistaisen tiedonsiirron, joka sisältää sekä kuvaa että puhetta. Tällöin on mahdollista implementoida laajassa kaupallisessa käytössä oleviin tietoliikennepäätelaitteisiin nykyistä monipuolisempia puheteknologian palveluja.
Puheteknologian voi katsoa olevan tärkeä osa tietoyhteiskunnan yhteiskunnallisten ulottuvuuksien tasapuolisesta toteuttamisesta, koska tällä tekniikalla suurempi osa väestöstä, ja myös suuri osa muuten syrjäytyvistä voisi päästä palvelujen piiriin.
Puheteknologia on selvästi monitieteinen alue, johon erikoistuvalle opiskelijalle olisi hyödyllistä saada opetusta usealta eri alueelta, esimerkiksi:
Pelkkä tällaisten kurssien tarjonta ei riitä, vaan kursseja pitää muokata ja sovittaa kokonaisuuteen yhteensopiviksi osiksi. Äänen, kuvan ja tekstin käsittelyn integrointi on myös otettava huomioon koulutuksen suuntautumisen vaihtoehdoissa.
Lista hyödyllisestä opetettavasta asiasta on pitkä, eikä ole kohtuullista odottaa, että jokainen puheteknologiaa opiskeleva hallitsisi yhtä hyvin kaikkia näitä alueita. Opetusta tulisi kuitenkin olla saatavilla kaikilta alueilta, vaikka esim. teknillisillä aloilla painotettaisiin fonetiikkaa ja kielen rakennetta ja analysointia vähemmän ja vastaavasti fonetiikan ja kielitieteen puolelta asiaa lähestyvät jäisivät pintapuolisemmalle ymmärrykselle matematiikan ja digitaalisen signaalinkäsittelyn suhteen. Joidenkin tulisi paneutua koko alueeseen menetelmien eteenpäin kehittämiseksi.
Tietokoneiden ja verkkojen käyttäjistä jo suurin osa on ei-ammattilaisia tavallisia ihmisiä, jolloin ihmisen ja koneen vuorovaikutuksesta muodostuu entistä tärkeämpi lenkki. Enää ei voida olettaa että palvelujen käyttäjät koulutettaisiin erityisesti, vaan palvelujen tulee olla riittävän ilmeisiä ja helppokäyttöisiä, jotta kaikki pystyisivät niitä käyttämään.
Myös luonnollisen kielen käyttöliittymät muodostavat monitieteisen kokonaisuuden, jossa voidaan hyödyntää monenlaista oppia, esim.:
Tiedon tulva on jo tämän hetken todellisuutta verkossa, mutta tulossa on ilmeisesti paljon mittavampi epäsuhta tarjolla olevan ja sulatettavissa olevan tiedon suhteen. Suomen kieli (kuin myös jossain määrin monet muutkin eurooppalaiset kielet) ovat erilaisia kuin englannin kieli, jossa sanat eivät juurikaan taivu, eikä yhdyssanoja kirjoiteta yhteen ilman sananväliä. Jo tällaisten tekijöiden neutralointi edellyttää melko pitkälle meneviä kieliteknologian menetelmiä. Vaativampi tehtävä on pyrkiä eristämään oikeaa ja olennaista tietoa silloin, kun sanontatavat ja ilmaukset vaihtelevat. Voidaan ennakoida, että ilman parhaita välineitä tiedon tulvasta ei tulla selviämään kunnialla.
Digitaalisiin dokumentteihin sisältyvän tiedon tehokas ja monipuolinen käyttö edellyttää monitieteistä osaamista, missä luonnolliseen kieleen liittyvä teknologia muodostaa yhden tärkeän osa-alueen. Muita osa-alueita ovat formaalit kielet, verkko-, tietokanta-, multimedia- ja käyttöliittymäteknologiat sekä ryhmätyön ja viestinnän, tilastotieteen sekä tietämyksen eristämisen (data mining) menetelmät.
Dokumenttien hallinnassa ja tiedonhaussa tarvitaan mm. seuraavanlaista opetusta:
Kielenoppimisen ja -opettamisen teknologia (engl. technology enhanced language teaching and learning) tarkoittaa tässä tietokoneavusteiseen kielenoppimiseen (engl. Computer Aided Language Learning, CALL) pedagogisesti ja teknologisesti laajentunutta lähestymistapaa kielenopetukseen ja -oppimiseen. Tässä keskitytään käsittelemään erityisesti kieliteknologiaan luontevasti liittyvää osaa alasta.
Teknologiset edellytykset kieliteknologian laajamittaiselle hyödyntämiselle kielten opiskelussa ovat olemassa, mutta hyödyntäminen edellyttää varsin monitieteisiä taitoja esim. kasvatustieteiden, kielenopetuksen, kielitieteiden ja multimedian aloilta. Näissä tehtävissä tarvitaan toisaalta kieliteknologian ammattilaisia ja sisällön tuottajia, sekä toisaalta viestinnän ammattilaisten ja opettajien olisi hyödyllistä hankkia tarvittavat yleistiedot menetelmistä.
Kielenopiskelun ja -opettamisen menetelmillä on kieliteknologian kanssa yhteistä aluetta runsaasti. Sen vuoksi kieliteknologian ammattilaisten tulisi voida suuntautua ja erikoistua kielenopetuksen menetelmiin ja päinvastoin ja saada monipuolista opetusta mm.:
Kielenkääntämisen tarve ja merkitys kasvaa Suomessa mm. Euroopan unionin ja sen tulevan laajenemisen vuoksi. Kääntämisen apuna käytetään nykyään runsaasti sekä tietoteknisiä että kieliteknologisia apuvälineitä, kuten elektronisia sanakirjoja, terminologiatyökaluja jne. sekä raakakäännösten tekemisessä myös automaattisen kielenkääntämisen menetelmiä. Kääntäjänkoulutuksessa oleville olisi tarjottava mahdollisuuksia hankkia riittävät tiedot ja tarvittaessa erikoistua tällaisiin menetelmiin. Tarvittavia aineksia ovat:
Yllä mainituille kieliteknologian sovellusaloille tarvitaan opettajia, sovellusalojen käyttöön tulisi kehittää yhä parempia menetelmiä ja kullekin alalle tarvitaan kieliteknologian erikoistaitajia mukaan hankkeisiin ja tutkimusryhmiin. Tätä varten pitää lisätä pääaineenaan kieliteknologiaa (tietokonelingvistiikkaa) opiskelevien valmistumistavoitteita olennaisesti, esim. 10-15 FM-tutkinnoksi vuodessa. Kieliteknologian pääaineopiskelijoiden rekrytointi tapahtuisi suurimmaksi osaksi muiden oppiaineiden opiskelijoista, jotka ovat jo suorittaneet esim. aineopinnot sopivassa aineessa.
Paitsi pääaineena kuvan 4.1 (ks. sivu
)
pyramidin ylintä osaa varten, tarvitaan kieliteknologian perus- ja
aineopintojen tasoista arvosanaopetusta myös pyramidin keskikerrosta
varten. Tällaiset arvosanat tulisivat sivuaineen opintoina osaksi eri
yliopistoissa suoritettaviin FM- tai DI-tutkintoihin, joiden pääaineet
vaihtelevat. Valtakunnallinen tarve tällaisille n. 20 ov laajuisille
sivuainearvosanoille arvioidaan noin 50:ksi vuosittain.
Kieliteknologian asiantuntijoiden työllistäjinä ovat ja voivat olla:
Ehdotetut toimenpiteet voidaan hahmottaa aiemmin sivulla
kuvassa 4.1 esitetyn pyramidimallin
pohjalta:
Ensimmäisen ryhmän koulutus koostuu olennaisesti ylemmän akateemisen loppututkinnon suorittamisesta pääaineenaan kieliteknologia. Toisen ryhmän koulutus koostuu olennaiselta osaltaan oman pääaineen mukaisesta loppututkinnosta, johon sisällytetään kieliteknologian sivuainearvosana joko perus- tai aineopintojen laajuisena. Kolmannen ryhmän koulutus on ensi sijassa oman pääaineen mukaista koulutusta, johon osana (tai vapaina opintoina) liittyy kieliteknologian yleistietoja esitteleviä kursseja sekä mahdollisia omaa erikoisalaa täydentäviä kieliteknologian erikoiskursseja opintojen eri vaiheissa.
Työryhmä ehdottaa, että perustetaan yksi valtakunnallinen kieliteknologian opetuksen verkosto, joka sisältää kieliteknologian maisteriohjelman. Verkosto toimii maisteriohjelman tapaan ryhmiä 1 ja 2 varten ja kurssien yhteiskäyttöä edistävän verkoston tapaan ryhmää 3 varten.
Erikoistuminen kieliteknologian ytimeen, sen eri tahoille suuntautuviin keskeisiin menetelmiin ja kieliteknologiaa hyödyntäviin eri aloihin muodostaa jatkumon. Opiskelijat voivat sovellusaloillaan hankkia eriasteisesti kieliteknologisia tietoja ja taitoja ja toisaalta kieliteknologiaa opiskelevat voivat eriasteisesti suuntautua jonkin sovellusalan menetelmiin.
Ryhmän 1 eli kieliteknologian ammattilaisten koulutus järjestetään siten, että opiskelijat suorittavat loppututkintonsa pääaineenaan kieliteknologia, mutta pääosa näistä opiskelijoista on aloittanut opintonsa kieliteknologiaa lähellä olevissa aineissa ja siirtyy verkostoon kuuluvaan maisterikouluun suoritettuaan noin 60 ov tällaisia muita opintoja. (Tällä hetkellä asetuksen mukaan HY:n humanistinen tiedekunta saa antaa kieliteknologian syventäviä opintoja.)
Maisterikoulu merkitsee ryhmän 1 opiskelijoille lähinnä kieliteknologian pääaineopiskelua tavoitteena FM-tutkinto. Kieliteknologian pääaineopiskelijoiden tulee voida ottaa verkoston piirissä olevista laitoksista yksittäisiä sovellusalojen kursseja pääaineensa erikoistumiskursseiksi ja tarvittaessa sivuaineen laajuisia arvosanoja tällaisista aineista.
Ryhmän 2 koulutus järjestetään hajautetusti eri yliopistoissa siten, että opiskelijat valmistuvat niillä laitoksilla, joilla pääaineopintojaan suorittavat, mutta suorittavat kieliteknologian kokonaisen arvosanan (tai kokonaisia arvosanoja) verkoston puitteissa. Kieliteknologian sivuainearvosanat suoritetaan kuitenkin Helsingin yliopiston yleisen kielitieteen laitoksella sen hyväksymien tutkintovaatimusten mukaisesti. Yksittäiset kurssit, joista arvosanat koostuvat, voivat olla myös verkoston piirissä olevilta muilta laitoksista.
Kokonaisten arvosanojen suorittaminen eri yliopistossa on nykyäänkin jossakin määrin mahdollista esim. JOO-sopimuksen puitteissa. Tällainen kokonaisten arvosanojen suorittaminen toisessa yliopistossa lienee tässä tapauksessa tarkoituksenmukaista, mutta sen toteuttaminen saattaa edellyttää lisäsopimuksia.
Kaikki yhteistyössä olevat laitokset muodostavat yhdessä kieliteknologian valtakunnallisen verkoston, jonka puitteissa yhteistyössä mukana olevien eri korkeakouluissa olevien laitosten opiskelijat voivat osallistua yksittäisille toisten yhteistyölaitosten kieliteknologisille kursseille, joiden suoritukset hyväksytään osaksi omassa laitoksessa suoritettavia opintoja.
Johdantokursseja ja muuta laajoille kuulijakunnille tarkoitettuja kursseja pyritään järjestämään mahdollisuuksien mukaan erikseen eri yliopistokaupungeissa. Erikoiskurssit järjestetään yleensä hajautetusti, kukin kurssi yhdessä paikassa siten, että verkoston muiden laitosten opiskelijoilla on käypä mahdollisuus osallistua niille.
Yliopistojen väliset yhteistyösopimukset antavat mahdollisuuden yksittäisten kurssien suorittamiseen toisessa yliopistossa. Sopimukset eivät tällä hetkellä kata kaikkia kyseeseen tulevia laitoksia. Verkoston laitosten kesken tulee tehdä mahdollisesti tarvittava erillinen sopimus, joka varmistaa opiskelijoiden mahdollisuuden hyödyntää verkoston toisten laitosten kieliteknologisia kursseja.
Kieliteknologian maisteriohjelman ja verkoston puitteissa nimetään kieliteknologian kunkin sovellus/osa-alueen koordinointiin jokin verkoston laitoksista vastuulliseksi kokoamaan tiedot saatavilla olevista kursseista, ohjaamaan neuvotteluja kurssien muotoilemiseksi eri tahojen koulutukseen yhteensopiviksi, suunnittelemaan osa-alueen opetusta sekä tiedottamaan tarjonnasta.
Koska suuri osa opetuksesta tapahtuu maantieteellisesti eri paikoissa, osapuolten tulee pyrkiä siihen, että kurssit järjestetään esim. tiiviinä periodina tai muuten sellaisina, että verkoston toisten laitosten opiskelijat voivat niihin kohtuullisesti osallistua. Tietoverkon pyritään hyödyntämään opetuksen tukena ristiinopiskelun helpottamiseksi.
Kieliteknologian valtakunnallisella maisterikoululla ja verkostolla tulee olla siihen osallistuvia laitoksia edustava johtoryhmä. Johtoryhmä ohjaa verkoston organisoitumista ja päättää esim. verkostolle yhteisesti myönnettyjen resurssien käytöstä.
Verkostolla tulee olla koordinaattori ja kullakin osallistuvalla laitoksella nimetty vastuuhenkilö.
Verkoston periaatteena (erityisesti 3. ryhmän opetuksen osalta) on se, että osallistuvat laitokset toimivat kahdessa roolissa: opiskelijoita lähettävinä ja vastaanottavina laitoksina. Vastaanottava laitos tarjoaa mahdollisuuksiensa mukaan saapuville opiskelijoille opetuksen ja tulevista kursseista hyvissä ajoin tiedon verkoston toisille osapuolille. Vastaanottava osapuoli ei (välttämättä) kirjaa opiskelijoita läsnäoleviksi opiskelijoiksi, mutta antaa opetuksen ja arvostelee ja hyväksyy suoritukset ja toimittaa niiden tulokset lähettävälle laitokselle.
Lähettävän laitoksen roolissa laitos puolestaan pitää huolen siitä, että tutkintovaatimuksissa on asianmukaiset sijat muualta saataville kursseille. Laitos tiedottaa muualla pidettävistä kursseista opiskelijoilleen ja täsmentää mihin ja minkä laajuisina kurssit kelpaavat tutkintovaatimuksiin (ja mahdollisista päällekkäisyyttä koskevista rajoituksista).
Pyrkimyksenä on päästä verkostossa summittaiseen vastavuoroisuuteen. Vaihto on ilmeisen edullista osapuolille, vaikka määrät eivät menisikään tasan.
Verkostolle perustetaan WWW-kotisivu ja sopiva elektroninen tiedotus (esim. uutisryhmä, sähköpostilista tai elektroninen lehti). Kukin osallistuva laitos huolehtii omalta osaltaan yhteisesti kiinnostavien tietojen tarjoamisesta omilla WWW-sivuillaan ja tarvittavien viitetietojen toimittamisesta yhteisen sivun ylläpitäjälle ja tiedotusta koordinoivalle taholle.
Kieliteknologian yliopistotasoisen koulutuksen laajentaminen ja uudistaminen edellyttää paitsi tieteiden välistä yhteistyötä, myös konkreettisia panostuksia:
Kieliteknologian yliopistotasoisen opetuksen laajentaminen toteutetaan toisaalta vahvistamalla kieliteknologian nykyistä arvosanaopetusta ja pääaineopiskelua ja toisaalta tuomalla kieliteknologian hyödyntämiseen suuntautuneita opetusresursseja kieliteknologiaa lähellä oleville aloille.
Kieliteknologian arvosanaopetuksen resurssien vahvistamiseksi esitetään 4 opetushenkilöä tai opetusta tukevaa henkilöä, joista 1-2 professorintasoisia opettajia ynnä varoja tarvittavaa tuntiopetusta, sekä infrastruktuuria varten. Näillä resursseilla tavoitteena on nostaa kieliteknologia pääaineenaan vuosittain valmistuvien maisterien määrä 10-15:een. Samalla kieliteknologian sivuainearvosanan suorittavien opiskelijoiden määrä nostetaan noin 50:een, joista pääosa suorittaa tutkintoaan verkoston muissa yliopistoissa.
Kieliteknologiaa lähellä olevien aloille esitetään 8 opetushenkilöä, joista 3 professorintasoisia sijoitettavaksi eri yliopistoissa oleviin laitoksiin.
Koulutuksen laajennus merkitsisi noin 10 miljoonan markan lisäresurssitarvetta vuosittain koko verkostolle. Työryhmä esittää että kieliteknologian koulutuksen laajentaminen otetaan valtakunnalliseksi ohjelmaksi yliopistojen tulossopimuskaudella 2001-2003.
Ohjelman toteuttaminen pitäisi saada alkuun jo vuonna 2000, mitä varten Helsingin yliopistolle tulisi ohjata voimavaroja noin 500000 markkaa toiminnan käynnistämiseksi.
Varat olisi pyrittävä ohjaamaan siten, että kieliteknologian koulutusta voitaisiin hyödyntää valtakunnallisesti ja monitieteisesti, jotta panostus edistäisi alan kehittymistä parhaalla tavalla.