Yliopiston etusivulle In English
Helsingin yliopisto
Kielenkäsittelyn sovellusohjelmat

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 29307

Connexorin englannin kielen dependenssijäsennin

1. Mitä ohjelma tekee?

Ohjelma en-fdg on englanninkielisen tekstin (morfologinen ja) syntaktinen jäsennysohjelma, joka jäsentää tekstiä virkkeittäin Lucien Tesnierin klassillisen dependenssisyntaksin periaatteiden tapaan.

2. Miten ohjelmaa käytetään?

Ohjelma käynnistyy Venus-palvelimella komennolla:

/usr/local/conexor/en/fdg/en-fdg

Ohjelma toimii erämuodossa eli käsittelee kokonaisen syöttötiedoston kerrallaan, eikä sitä voine käyttää vuorovaikutteisesti.

Vipusilla --help tai -h saa hieman lisätietoa ohjelman muista vipusista, joilla ohjelman toimintaa voi säädellä. Oletuksena ohjelma tulostaa jäsennystuloksen XML-muotoisena, joka on sovelias erityisesti toisilla ohjelmilla käsittelemistä varten. Ihmissilmä usein lukee mieluummin pelkistettyä tekstimuotoita tulostusta, jonka saa --text -vipusella.

Käyttöesimerkki

Seuraavassa ohjelmalle syötetään pieni pätkä englanninkielistä tekstiä (eli: I have a dog. The dog is mine.), jonka jälkeen syöttötiedosto lopetetaan antamalla C-d päätteen näppäimistöltä. Tämä liittyy tietenkin testaukseen, normaali syöttötiedosto loppuu luonnollisella tavalla.


venus :~  
$ /usr/local/conexor/en/fdg/en-fdg --text
Conexor FDG 3.7 (en 3.7)            www.conexor.fi
(c) Conexor oy, 1997-2002       support@conexor.fi
Academic License: Department of General Linguistics, University of Helsinki
I have a dog. The dog is mine.
1       I       i       subj:>2 @SUBJ %NH PRON PERS NOM SG1
2       have    have    main:>0 @+FMAINV %VA V PRES
3       a       a       det:>4  @DN> %>N DET SG
4       dog     dog     obj:>2  @OBJ %NH N NOM SG
5       .       .
6       <s>     <s>
1       The     the     det:>2  @DN> %>N DET
2       dog     dog     subj:>3 @SUBJ %NH N NOM SG
3       is      be      main:>0 @+FMAINV %VA V PRES SG3
4       mine    i       comp:>3 @PCOMPL-S %NH PRON PERS GEN SG1 INDEP
5       .       .
6       <s>     <s>


     

Yksityiskohtainen ohje FDG-ohjelman käytöstä on laitoksen ns. Intranet-sivuilla, joiden käyttämiseksi tarvitaan samaa käyttäjätunnusta ja salasanaa kuin esim. Venus-palvelimella.

3. Ohjelman käyttöä koskevat rajoitukset

Connexor Oy:n tekemä en-fdg -ohjelma on lisensioitu ehdoilla, jotka rajaavat sen käytön laitoksen antamaan opetukseen ja laitoksella tehtävään tutkimukseen (... right to use ... solely for academic and non-profit research and education).

Erityisesti lisenssiehdoissa laitos on sitoutunut:

  • parhaansa mukaan varmistumaan siitä, että ohjelmat pysyvät laitoksen tiloissa,
  • pitämään huolta siitä, että ohjelmia tai niiden osia ei kopioida eikä siirretä kolmansille osapuolille (ilman omistajan kirjallista lupaa),
  • tiedottamaan laitoksen työntekijöille, vieraileville opettajille ja tutkijoille sekä opiskelijoille ohjelmia koskevista rajoituksista ja
  • ilmoittamaan viipymättä mahdollisista väärinkäytöksistä ohjelmiston omistajalle.

4. Ohjelman alkuperä, kirjallisuusviitteet ja linkit

Ohjelmat perustuvat osaltaan yleisen kielitieteen laitoksen piirissä tehtyyn mm. Pasi Tapanaisen, Atro Voutilaisen ja Timo Järvisen tutkimustyöhön, jonka jälkeen Connexor Oy on kehittänyt käsillä olevan tuotteen, joka koostuu säännöstöistä, sanakirjoista ja tietokoneohjelmista.