Yliopiston etusivulle In English
Helsingin yliopisto
Kielenkäsittelyn sovellusohjelmat

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 29307

Connexorin ruotsin kielen dependenssijäsennin

1. Mitä ohjelma tekee?

Ohjelma sv-fdg on ruotsinkielisen tekstin (morfologinen ja) syntaktinen jäsennysohjelma, joka jäsentää tekstiä virkkeittäin Lucien Tesnierin klassillisen dependenssisyntaksin periaatteiden tapaan.

2. Miten ohjelmaa käytetään?

Ohjelma käynnistyy Venus-palvelimella komennolla:

/usr/local/conexor/sv/fdg/sv-fdg

Ohjelma toimii erämuodossa eli käsittelee kokonaisen syöttötiedoston kerrallaan, eikä sitä voine käyttää vuorovaikutteisesti.

Vipusilla --help tai -h saa hieman lisätietoa ohjelman muista vipusista, joilla ohjelman toimintaa voi säädellä. Oletuksena ohjelma tulostaa jäsennystuloksen XML-muotoisena, joka on sovelias erityisesti toisilla ohjelmilla käsittelemistä varten. Ihmissilmä usein lukee mieluummin pelkistettyä tekstimuotoita tulostusta, jonka saa --text -vipusella.

Käyttöesimerkki

Seuraavassa ohjelmalle syötetään pieni pätkä ruotsiinkielistä tekstiä (eli: Jag har en hund. Hunden är min.), jonka jälkeen syöttötiedosto lopetetaan antamalla C-d päätteen näppäimistöltä. Tämä liittyy tietenkin testaukseen, normaali syöttötiedosto loppuu luonnollisella tavalla.


venus :~  
$ /usr/local/conexor/sv/fdg/sv-fdg --text
Conexor FDG 3.7 (sv 2.2)            www.conexor.fi
(c) Conexor oy, 1997-2002       support@conexor.fi
Academic License: Department of General Linguistics, University of Helsinki
Jag har en hund. Hunden är min.
1       Jag     jag     subj:>2 %NH PRON SG NOM
2       har     ha      main:>0 %MV V PRES
3       en      en      det:>4  %>N DET SG NOM
4       hund    hund    obj:>2  %NH N SG NOM
5       .       .
1       Hunden  hund    subj:>2 %NH N SG NOM
2       är      vara    main:>0 %MV V PRES
3       min     min     sc:>2   %NH N SG NOM
4       .       .
1       <s>     <s>


     

Yksityiskohtainen ohje FDG-ohjelman käytöstä on laitoksen ns. Intranet-sivuilla, joiden käyttämiseksi tarvitaan samaa käyttäjätunnusta ja salasanaa kuin esim. Venus-palvelimella.

3. Ohjelman käyttöä koskevat rajoitukset

Connexor Oy:n tekemä en-fdg -ohjelma on lisensioitu ehdoilla, jotka rajaavat sen käytön laitoksen antamaan opetukseen ja laitoksella tehtävään tutkimukseen (... right to use ... solely for academic and non-profit research and education).

Erityisesti lisenssiehdoissa laitos on sitoutunut:

  • parhaansa mukaan varmistumaan siitä, että ohjelmat pysyvät laitoksen tiloissa,
  • pitämään huolta siitä, että ohjelmia tai niiden osia ei kopioida eikä siirretä kolmansille osapuolille (ilman omistajan kirjallista lupaa),
  • tiedottamaan laitoksen työntekijöille, vieraileville opettajille ja tutkijoille sekä opiskelijoille ohjelmia koskevista rajoituksista ja
  • ilmoittamaan viipymättä mahdollisista väärinkäytöksistä ohjelmiston omistajalle.

4. Ohjelman alkuperä, kirjallisuusviitteet ja linkit

Ohjelmat perustuvat osaltaan yleisen kielitieteen laitoksen piirissä tehtyyn mm. Pasi Tapanaisen, Atro Voutilaisen ja Timo Järvisen tutkimustyöhön, jonka jälkeen Connexor Oy on kehittänyt käsillä olevan tuotteen, joka koostuu säännöstöistä, sanakirjoista ja tietokoneohjelmista.