Koltansaamen transduktorien arvioinnista ja kehittämisestä

Tällä hetkellä kieliteknologinen hanke edistää koltansaamen morfologista dokumentointia laajentamalla transduktoreita taivutusopillisin kuvauksin. Käytännössä tätä kehitystä voidaan seurata ainakin neljällä tavalla:
(1) käymällä Giellateknon koltansaamen työkalut-sivulla, mistä on linkkejä analysaattoreihin
(2) sanakirjoihin,
(3) rakenteilla oleviin Nuõrti-harjoituksiin, tai sitten hakemalla
(4) Koltansaamen oikolukusovellus LibreOffice:n käyttöön


Tässä kerron transduktorin arvioinnista oikeinkirjoitussovelluksen avulla.

Koska kyseessä onkin vasta kehitteillä oleva sovellus, virheitä näkyy paljon:

  1. osa on aitoja virheitä (sana on kirjoitettu väärin) tai
  2. osa virheistä johtuu siitä, että sanaa tai sen taivutusta ei ole vielä saatu työkaluun.

Tehtäväksi otetaan 2:sen dokumentointi, eli sanojen tai sanamuotojen puuttumisesta tiedottaminen.

Sen jälkeen on uusin oxt versio asennettu oman koneen LibreOfficeen, voi kirjoittaa vapaata tekstiä .odt- tai .doc-tiedostoon tai sitten avata jo olemassa olevan tiedoston ja määritellä tekstin koltansaamenkieliseksi. Kannattaa varmistaa, että on tuorein sms_LO-voikko-4.0-win.oxt tai sms_LO-voikko-4.0-mac.oxt käytössä. Uusia ladataan lähes viikoittain, joten eniten hyötyä saadaan tuoreimmista oikolukusovelluksista.

Jos tekstissä esiintyy sanamuotoja, joiden alla on punainen viiva, ja haluat ilmoittaa asiasta, tee seuraavasti:

  1. varmista, että käytät oikeita kirjaimia, Timothy Feistin tekemä näppäimistö tuottaa oikeita merkkejä windowsiin, maceissä voi käyttää minun tekemää, androidia varten Giellateknon kehittämää.
  2. muista, tässä kirjoitetaan normatiivisella oikeinkirjoituksella (Ǩiõllkaʹlddi), pedagogisesti käytettävistä kirjaimista ja merkeistä kerron alempana.
  3. kirjoita yhdelle riville vasemmalta oikealle PERUSMUOTO, SANALUOKKA_, (SANAMUOTO)
  4. sanaluokkia: A_ = adjektiivi, ADV_ = adverbi, CC_ = rinnasteinen konjunktio, CS_ = alisteinen konjunktio, INTERJ_ = interjektio, N_ = substantiivi, NUM_ = numero, PO_ = postpositio, PR_ = prepositio, PRON_ = pronomini, PROP_ = propri, V_ = verbi
  5. Jos perusmuotokin on tunnistamaton, kannattaa lisätä vielä dokumentin loppuun sanasto:

Sanastossa on siis kolme osaa: perusmuoto, sanaluokka ja sitaateissa käännös tai käännökset.
Käännöksiä voi olla enemmmän kuin yksi.
Tärkeimmät kielikoodit näkyvät (kaarisulkeissa).
Kauttaviiva erottaa kielet
useampi samankielinen käännös erotetaan pystyviivalla.

Ota yhteyttä minuun (Jack Rueter: risttnõmm.famiʹljnõmm(ät)helsinki.fi ), haluan jatkokehittää sitä työtä, jota ovat tehneet monet muut. Kiitoksia erityisesti, Merja Fofonoffille, Tiina Sanila-Aikiolle, Satu Moshnikoffille, Eino Koposelle ja Pekka Sammallahdelle arvokkaasta työstä ja palautteesta, ja Teille jokaiselle, joka kokeilet ja edistät koltankielen kieliteknologista kehitystä.


Jos haluaa täsmentää pedagogista paradigmaa, ja on paljon sellaisia sanoja, jotka kaipaavat selvitystä, kannattaa luetella useampi muoto:

Tällä hetkellä ei ole erillistä oikolukusovellusta pedagogista ortografiaa varten. Tarvittaessa voidaan väliaikaisesti sellainenkin tehdä.


Lisää tietoja saa Jack Rueterin oikeinkirjoitussovelluksen kehityssivuilta.


Tääiʹben lij i sääʹnnkeʹrjj.
Kuäʹss šâdd lääddas joortõs, sääʹnn lij sääʹnnǩeeʹrjest da morfologia tuåimm.
Kuäʹss šâdd näkkam teʹkstt: »Meaning not found» morfologia tuåimm, sääʹnn lij sääʹnnǩeeʹrjest pâi lääʹddǩiõllsaž joortõs iʹlla.
Kuäʹss šâdd näkkam teʹkstt: »Unknown word» sääʹnn iʹlla sääʹnnǩeeʹrjest.


Jack Rueter: risttnõmm.famiʹljnõmm(ät)helsinki.fi .


Last modified: Wed Jun 17 11:26:17 EEST 2015