Yliopiston etusivulle In English
Helsingin yliopisto
Nykykielten laitos: Kieliteknologian oppiaine

Yhteystiedot

Nykykielten laitos

PL 24 (Unioninkatu 40)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 28313

FinnWordNet: Lataa tiedostoja

FinnWordNetin datatiedostot voi ladata kolmessa eri muodossa. FinnWordNetin sanastotietokannan kääntäminen itse edellyttää WordNetin Grind-ohjelman muokattua versiota. FinnWordNetin (ja Princeton WordNetin) sisältö on pohjana myös HFST-transduktoreissa, jotka toimivat synonyymi- tai käännössanakirjoina.

Datatiedostot

FinnWordNetin datatiedostoja on ladattavissa kolmessa eri muodossa ZIP-paketteina. Lisätietoja pakettien yhteisestä LUEMINUT-tiedostosta.

FinnWordNet-datatiedostojen käyttäminen wn-hakuohjelmalla edellyttää Debianin korjaamaa ohjelmaversiota.

Muokattu Grind-ohjelma

FinnWordNetin lexicographer-tiedostojen kääntäminen WordNet-datatiedostoiksi edellyttää Princetonin WordNet 3.0 Grind -ohjelman muokattua versiota. Koska WordNet-datatiedostot ovat yllä ladattavissa, muokattua Grind-ohjelmaa tarvitsee lähinnä vain silloin, jos muokkaa FinnWordNetin sisältöä (lexicographer-tiedostoja).

Muokatun Grind-ohjelman lähdekoodi on ladattavissa sekä itsenäisenä pakettinaan että paikkaustiedostona (patchina), joka edellyttää alkuperäisen WordNet Grind -ohjelman lähdekoodia. Kummassakin tapauksessa ohjelman kääntäminen edellyttää Unix-, Linux- tai vastaavaa ympäristöä sekä C-kääntäjää. Lisätietoa muokatusta Grind-ohjelmasta on englanninkielisessä README-tiedostossa.

FinnWordNetiin perustuvat synonyymi- ja käännöstransduktorit

FinnWordNetin (ja Princeton WordNetin) sisältö on pohjana myös HFST-muotoisissa äärellisissä transduktoreissa, jotka toimivat suomen tai englannin synonyymisanakirjoina tai suomi–englanti- tai englanti–suomi-käännössanakirjoina. Transduktorit tunnistavat sanat myös taivutetuissa muodoissa, ja synonyymisanakirjoista on versiot, jotka tuottavat synonyymit syötesanan taivutusmuodossa. Lisätietoa transduktoreista on LUEMINUT-tiedostossa.

Transduktorien käyttämiseen tarvitsee joko täyden HFST-kirjaston ja -työkalut (version 3.2.0 tai uudemman), erillisen HFST optimized lookup -ohjelman (version 1.3 tai uudemman) tai optimized lookupin Java-toteutuksen (2011-05-23 tai uudemman).

Hae laitoksen sivuilta:

Laitoksen etusivulle | Tiedekunnan etusivulle | Yliopiston etusivulle

Copyright © 2003-2005 Helsingin yliopisto. Kaikki oikeudet pidätetään.