Yliopiston etusivulle In English
Helsingin yliopisto
Kielenkäsittelyn sovellusohjelmat

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 29307

LingSoftin ruotsin kielen morfologinen jäsennin TW-SWE

1. Mitä ohjelma tekee?

Ohjelma tw-swe on ruotsin kielen morfologinen jäsennin eli morfologinen analysaattori, joka tunnistaa ruotsinkielisiä sananmuotoja ja päättelee niille mahdolliset perusmuodot, sanaluokat ja taivutusmuodot.

2. Miten ohjelmaa käytetään?

Ohjelma toimii toistaiseksi vain Angarakilla ja se käynnistyy niillä palvelimilla komennolla:

      tw-swe -Xu
    

Komennolla man tw-swe saa lisää tietoa ohjelman käytöstä, mm. erilaisista vipusista, joilla ohjelman toimintaa ja sen tulostusmuotoa voidaan säädellä. Huomaa, että tälle ohjelmalle on tarpeen normaalisti antaa vipunen -X, jotta se tulostaisi sananmuodoille perusmuodon. (Ilman vipusta se tulostaa sananmuodon perusmuodon paikalla, mutta senkin varustettuna erinäisillä rajamerkeillä.)

Käyttöesimerkki

   $ tw-swe -Xu

   SWETWOL 040917
   Copyright (C) Lingsoft, Inc. 1994

   TWOL 2004/08/20
   Copyright (C) K. Koskenniemi and Lingsoft, Inc. 1983-2004
   Two-Level Compiler
   Copyright (C) 1994, Xerox Corporation. All rights reserved.
   .. save file loaded
   frukosten
   "<frukosten>"
	   "frukost"  N UTR DEF SG NOM
	   "frukost"  <FEM> N UTR DEF SG NOM

   är 
   "<är>"
	   "vara"  <COP> V ACT PRES

   viktig
   "<viktig>"
	   "viktig"  A UTR INDEF SG NOM
	   "viktiga"  V ACT IMP

Jos haluaa sananrajat mukaan, on käytettävä lisävipusta, esim. tw-swe -Xu#_ jolloin perusmuotoihin tulee alaviiva sananrajan kohdalle. Vipunen puolestaan poistaa teknisistä syistä joskus syntyvät toistot tulostuksesta.

3. Ohjelman käyttöä koskevat rajoitukset

Sekä ohjelma (twol-r), ruotsin kielen leksikko että säännöstö ovat tekijänoikeuden alaisia ja niiden kaupalliset oikeudet ovat Lingsoft Oy:llä. Ohjelmaa saadaan käyttää laitoksella opetus- ja tutkimustarkoituksissa tarkkaan määriteltyjen lisenssiehtojen puitteissa. Ohjelman käyttäminen edellyttää student -ryhmän jäsenyyttä.

4. Ohjelman alkuperä, kirjallisuusviitteet ja linkit

Ohjelma perustuu Kimmo Koskenniemen väitöskirjaan, jonka ohjelmaa on kehitetty edelleen Lingsoftissa ja kuvaus laajennettu koko kieltä kattavaksi. Ruotsin kielen leksikko ja säännöstö on kehitetty Lingsoft Oy:ssä ja ne perustuvat Fred Karlssonin aiempaan, tutkimustarkoituksiin tekemiin versioihin.

Kimmo Koskenniemi, Two-level morphology: A general computational model for word-form recognition and production. University of Helsinki, Department of General Linguistics, Publications, No. 11, 1983.

Lingsoft Oy:n sivuilta löytyy demoversio tw-swe -ohjelmasta .