Yliopiston etusivulle In English
Helsingin yliopisto
Kielenkäsittelyn sovellusohjelmat

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 29307

Connexorin suomen kielen dependenssijäsennin

1. Mitä ohjelma tekee?

Ohjelma fi-fdg on suomenkielisen tekstin (morfologinen ja) syntaktinen jäsennysohjelma, joka jäsentää tekstiä virkkeittäin Lucien Tesnierin klassillisen dependenssisyntaksin periaatteiden tapaan.

2. Miten ohjelmaa käytetään?

Ohjelma käynnistyy komennolla:

/usr/local/conexor/fi/fdg/fi-fdg

Ohjelma toimii erämuodossa eli käsittelee kokonaisen syöttötiedoston kerrallaan, eikä sitä voine käyttää vuorovaikutteisesti.

Vipusilla --help tai -h saa hieman lisätietoa ohjelman muista vipusista, joilla ohjelman toimintaa voi säädellä. Oletuksena ohjelma tulostaa jäsennystuloksen XML-muotoisena, joka on sovelias erityisesti toisilla ohjelmilla käsittelemistä varten. Ihmissilmä usein lukee mieluummin pelkistettyä tekstimuotoita tulostusta, jonka saa --text -vipusella.

Käyttöesimerkki

Seuraavassa ohjelmalle syötetään pieni pätkä suomenkielistä tekstiä (eli: Ohjelma syö tällaista. Tulostaa sitten tätä.), jonka jälkeen syöttötiedosto lopetetaan antamalla C-d päätteen näppäimistöltä. Tämä liittyy tietenkin testaukseen, normaali syöttötiedosto loppuu luonnollisella tavalla.

     $ /usr/local/conexor/fi/fdg/fi-fdg --text
     Conexor FDG 3.7 (fi 2.2)            www.conexor.fi
     (c) Conexor oy, 1997-2002       support@conexor.fi
     Academic licence: Helsingin Yliopisto
     Ohjelma syö tällaista.  Tulostaa sitten tätä.
     [C-d]
     1       Ohjelma ohjelma subj:>2 &NH N SG NOM
     2       syö     syödä   main:>0 &+MV V ACT IND PRES SG3
     3       tällaista       tällainen  &NH A SG PTV
     4       .       .
     5       <s>     <s>
     1       Tulostaa        tulostaa   main:>0 &+MV V ACT IND PRES SG3
     2       sitten  sitten  tmp:>1  &ADV ADV
     3       tätä    tämä    obj:>1  &NH PRON SG PTV
     4       .       .
     5       <s>     <s>

Yksityiskohtainen ohje FDG-ohjelman käytöstä on laitoksen ns. Intranet-sivuilla, joiden käyttämiseksi tarvitaan samaa käyttäjätunnusta ja salasanaa kuin esim. Venus-palvelimella.

3. Ohjelman käyttöä koskevat rajoitukset

Connexor Oy:n tekemä fi-fdg -ohjelma on lisensioitu ehdoilla, jotka rajaavat sen käytön laitoksen antamaan opetukseen ja laitoksella tehtävään tutkimukseen (... right to use ... solely for academic and non-profit research and education).

Erityisesti lisenssiehdoissa laitos on sitoutunut:

  • parhaansa mukaan varmistumaan siitä, että ohjelmat pysyvät laitoksen tiloissa,
  • pitämään huolta siitä, että ohjelmia tai niiden osia ei kopioida eikä siirretä kolmansille osapuolille (ilman omistajan kirjallista lupaa),
  • tiedottamaan laitoksen työntekijöille, vieraileville opettajille ja tutkijoille sekä opiskelijoille ohjelmia koskevista rajoituksista ja
  • ilmoittamaan viipymättä mahdollisista väärinkäytöksistä ohjelmiston omistajalle.

4. Ohjelman alkuperä, kirjallisuusviitteet ja linkit

Ohjelmat perustuvat osaltaan yleisen kielitieteen laitoksen piirissä tehtyyn mm. Pasi Tapanaisen, Atro Voutilaisen ja Timo Järvisen tutkimustyöhön, jonka jälkeen Connexor Oy on kehittänyt käsillä olevan tuotteen, joka koostuu säännöstöistä, sanakirjoista ja tietokoneohjelmista.