Yliopiston etusivulle In English
Helsingin yliopisto
Kielenkäsittelyn sovellusohjelmat

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 29307

Kielikoneen yksiselitteistävä morfologinen jäsennin TEXTMORFO

1. Mitä ohjelma tekee?

Kielikoneen Textmorfo-ohjelma jäsentää ja yksiselitteistää suomenkielistä tekstiä. Ohjelma sisältää toisaalta Kielikone Oy:n morfologisen MORFO-jäsentimen ja toisaalta dependenssijäsentimen, joka yksiselitteistää MORFOn mahdolliset moniselitteiset analyysit.

2. Miten ohjelmaa käytetään?

TEXTMORFO toimii Venus-palvelimella ja käynnistyy komennolla:

      venus:$ /usr/local/textmorfo/bin/textmorfo
    

Käyttöesimerkki

venus:
$ /usr/local/textmorfo/bin/textmorfo 
----------------------------------------------
TextMorfo v.2.0 -- (C) Kielikone Oy 1999
----------------------------------------------
luennon alusta on kulunut tunti.
BaseForm=alku,SurfaceForm=alusta,Category=Noun,Case=El,Number=SG,
   BasicPart=alku,Component=,Position=2,Tense=,Voice=,Modal=,
   PersonN=,PersonP=,Clitic1=,Clitic2=,Comparison= 
BaseForm=_PERIOD,SurfaceForm=.,Category=Delimiter,Case=,Number=,
   BasicPart=_PERIOD,Component=,Position=6,Tense=,Voice=,Modal=,
   PersonN=,PersonP=,Clitic1=,Clitic2=,Comparison= 
BaseForm=tunti,SurfaceForm=tunti,Category=Noun,Case=Nom,Number=SG,
   BasicPart=tunti,Component=,Position=5,Tense=,Voice=,Modal=,
   PersonN=,PersonP=,Clitic1=,Clitic2=,Comparison= 
BaseForm=kulua,SurfaceForm=kulunut,Category=Verb,Case=Nom,
   Number=SG,BasicPart=kulua,Component=,Position=4,Tense=,
   Voice=Act,Modal=IIpartic,PersonN=,PersonP=,Clitic1=,Clitic2=,
   Comparison= 
BaseForm=luento,SurfaceForm=luennon,Category=Noun,Case=Gen,
   Number=SG,BasicPart=luento,Component=,Position=1,Tense=,
   Voice=,Modal=,PersonN=,PersonP=,Clitic1=,Clitic2=,Comparison= 
BaseForm=olla,SurfaceForm=on,Category=Verb,Case=,Number=,
   BasicPart=olla,Component=,Position=3,Tense=Pr,Voice=Act,
   Modal=Ind,PersonN=S,PersonP=3P,Clitic1=,Clitic2=,Comparison= 
---------------------------------------------------------------- 

Ohjelma tulostaa kustakin saneesta yhden, yleensä pitkän rivin. Yllä pitkät rivit on jaettu useammaksi, jotta niitä olisi helpompi lukea. Huomaa, että saneet eivät tulostu samassa järjestyksessä kuin, missä ne ovat alkuperäisessä tekstissä. On myös huomattava, että kansalliset ääkköset muuntuvat tulostuksessa aaltosuluiksi jne, esim. "hän" muuntuu muotoon:

      BaseForm=h{n,SurfaceForm=h{n,Category=Pronoun,Case=Nom,...
    

3. Ohjelman käyttöä koskevat rajoitukset

Ohjelman käyttö on sallittua ei-kaupallisiin opetus- ja tutkimustarkoituksiin laitoksen sisällä.

4. Ohjelman alkuperä, kirjallisuusviitteet ja linkit

Ohjelman on Kielikone Oy:n omaisuutta. Ks. esim.

  • Jäppinen, H.; Lehtola,A.; Nelimarkka, E.; and Ylilammi, N., "Knowledge Engineering Approach to Morphological Analysis", First Conference of the European Chapter of ACL, Pisa, Italy, 1983, pp. 49-51.
  • Harri Jäppinen and Matti Ylilammi, "Associative Model of Morphological Analysis: An Empirical Inquiry", Computational Linguistics, Vol. 12, No 4, 1986, pp. 257-272.
  • Valkonen, K., Jäppinen, H., and Lehtola, A., "Blackboard-based dependency parsing". In Proceedings of IJCAI'87, Tenth International Joint Conference on Artificial Intelligence, 1987, pp. 700-702.