Yliopiston etusivulle In English
Helsingin yliopisto
Nykykielten laitos: Kieliteknologian oppiaine

Yhteystiedot

Nykykielten laitos

PL 24 (Unioninkatu 40)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (0) 2941 (vaihde)
Faksi +358 (0) 2941 23072

HUOMAA: FinnWordNet-demojen ja ladattavien tiedostojen osoitteet ovat muuttuneet, eivätkä nykyiset osoitteet ole välttämättä lopulliset. Demot ja tiedostojen lataus olivat poissa käytöstä maaliskuusta kesäkuuhun 2018. Edelleenkään kaikki demot eivät toimi, ja palautelomake on poissa käytöstä. Pahoittelemme asiaa. (Päivitetty 2018-07-03.)

FinnWordNet: Lataa tiedostoja

FinnWordNetin datatiedostot voi ladata kolmessa eri muodossa. FinnWordNetin sanastotietokannan kääntäminen itse edellyttää WordNetin Grind-ohjelman muokattua versiota. FinnWordNetin (ja Princeton WordNetin) sisältö on pohjana myös HFST-transduktoreissa, jotka toimivat synonyymi- tai käännössanakirjoina.

Datatiedostot

FinnWordNetin datatiedostoja on ladattavissa kolmessa eri muodossa ZIP-paketteina. Lisätietoja pakettien yhteisestä LUEMINUT-tiedostosta.

  • fiwn_rels_fi.zip (11,2 MiB) (LUEMINUT):
    FinnWordNet-data relaatiomuodossa: synonyymijoukot, sananmerkitykset, synonyymijoukkojen ja sanojen väliset suhteet sekä käännössuhteet
  • fiwn_lists_fi.zip (8,3 MiB) (LUEMINUT):
    FinnWordNet-datasta tuotettuja listoja, jotka täydentävät relaatiomuotoista dataa
  • fiwn_dict_fi.zip (10,4 MiB) (LUEMINUT):
    WordNet-datatiedostot (wn-hakuohjelman käyttämässä muodossa)
  • fiwn_lex_fi.zip (5,1 MiB) (LUEMINUT):
    Lexicographer-tiedostot (datatiedostojen lähdemuoto)

FinnWordNet-datatiedostojen käyttäminen wn-hakuohjelmalla edellyttää Debianin korjaamaa ohjelmaversiota.

Muokattu Grind-ohjelma

FinnWordNetin lexicographer-tiedostojen kääntäminen WordNet-datatiedostoiksi edellyttää Princetonin WordNet 3.0 Grind -ohjelman muokattua versiota. Koska WordNet-datatiedostot ovat yllä ladattavissa, muokattua Grind-ohjelmaa tarvitsee lähinnä vain silloin, jos muokkaa FinnWordNetin sisältöä (lexicographer-tiedostoja).

Muokatun Grind-ohjelman lähdekoodi on ladattavissa sekä itsenäisenä pakettinaan että paikkaustiedostona (patchina), joka edellyttää alkuperäisen WordNet Grind -ohjelman lähdekoodia. Kummassakin tapauksessa ohjelman kääntäminen edellyttää Unix-, Linux- tai vastaavaa ympäristöä sekä C-kääntäjää. Lisätietoa muokatusta Grind-ohjelmasta on englanninkielisessä README-tiedostossa.

FinnWordNetiin perustuvat synonyymi- ja käännöstransduktorit

FinnWordNetin (ja Princeton WordNetin) sisältö on pohjana myös HFST-muotoisissa äärellisissä transduktoreissa, jotka toimivat suomen tai englannin synonyymisanakirjoina tai suomi–englanti- tai englanti–suomi-käännössanakirjoina. Transduktorit tunnistavat sanat myös taivutetuissa muodoissa, ja synonyymisanakirjoista on versiot, jotka tuottavat synonyymit syötesanan taivutusmuodossa. Lisätietoa transduktoreista on LUEMINUT-tiedostossa.

Transduktorien käyttämiseen tarvitsee joko täyden HFST-kirjaston ja -työkalut (version 3.2.0 tai uudemman), erillisen HFST optimized lookup -ohjelman (version 1.3 tai uudemman) tai optimized lookupin Java-toteutuksen (2011-05-23 tai uudemman).

Hae laitoksen sivuilta:

Laitoksen etusivulle | Tiedekunnan etusivulle | Yliopiston etusivulle

Copyright © 2003-2005 Helsingin yliopisto. Kaikki oikeudet pidätetään.