logo

IT-INFO
Usein kysyttyä
Käyttöluvat
Käyttösäännöt
Linux-ohjeita
LT-ohjelmat
Windows
Unix-luokka
Unix-neuvonta
Yhteydenotto
Ylläpitohenkilöstö

WordNet

WordNet on Princetonin yliopistossa kehitetty merkityksistä koostuva "sanaverkko" tai oikeammin "merkitysverkko". Kullekin merkitykselle on määritetty synset eli joukko sanoja/lausekkeita, jotka voivat jossain kontekstissa tarkoittaa kyseistä merkitystä. Eli kuhunkin merkitykseen viittaa yksi tai useampi sana ja jokainen sana viittaa yhteen tai useampaan merkitykseen. Moniselitteisyyden ansiosta sanat verkottuvat keskenään. Synsetiin talletetun rinnastuksen lisäksi sanoista on talletettu myös muuta tietoa: ylä- ja alakäsitteet, osasuhteita, antonyymejä tms. Verkko on käsin laadittu, joten tehdyt ratkaisut ovat tietysti subjektiivisia.

Ohjelma on englanninkielinen. Laitoksella on käytössä ohjelmasta versio 1.7. Saatavilla on versio 1.7.1. Ohjelma löytyy ainakin venus-palvelimelta. Ohjelmaa kuuluu sekä tekstipohjainen että graafinen liittyvä. Graafinen liittymä käynnistyy käskyllä wnb. Tekstipohjaista versiota kutsutaan muodossa

wn sana -optiot

Esimerkki, jossa option -synsn tulostetaan sanan 'entry' substatiivisynsetit (sekä kunkin merkin yläluokka):

wn entry -synsn

Ohjeita tekstiliittymästä saa pelkällä käskyllä wn.

Laitoksen kirjastosta löytyy WordNetiä käsittelevä WordNet - An Electronic Lexical Database -kirja. WordNetistä on tehty versiot alunperin kuudelle eurooppalaiselle kielelle (ns. EuroWordNet, mukana hollanti, italia, espanja, saksa, ranska, tsekki ja viro), jotka käyttävät alkuperäisen WordNetin käyttöliittymän versiota 1.5. Nämä eivät kuitenkaan ole täysin ilmaisia, eikä niitä ole meille asennetuna. Projektista on olemassa samanniminen kirja, joka sekin löytyy laitoksen kirjastosta.


ohjelmatuki@ling.helsinki.fi 
Wed Apr 27 13:41:04 2005