Finnish Speech Technology: A Multidisciplinary Project (SuoPuhe)

Nämä sivut ovat TEKESin rahoittaman Finnish Speech Technology: A Multidisciplinary Project -projektin puhesynteesiosan epävirallisia sivuja (SuoPuhe TEKES 40285/00, 40406/01, 40238/02, HY 460325). Projektin virallinen kuvaus löytyy TEKESin sivuilta. Projekti päättyi huhtikuun 2003 lopussa.

Miesäänen sisältävä hy_fi_mv_diphone-äänimoduli Festivaliin ja tekstinlavennin on julkaistu LGPL-lisenssin alla. Voit hakea ne osoitteesta http://www.ling.helsinki.fi/suopuhe/download/. Naisääni julkaistaan hamassa tulevaisuudessa.

Puhesynteesiosiossa kehitettiin Edinburghin yliopistossa kehitetyn Festival-puhesyntesialustan päälle kaksi suomenkielistä ääntä. Äänen perustuvat difonikonkatenaatioon, jossa aikaisemmin nauhoitettuja äännepareja mallinnitaan matkapuhelimissa käytetyn lineaarisen ennustamisen avulla (LPC).

Lisäksi kehitettiin erillinen Perlillä toimiva tekstinlavennusmoduli, joka korvaa tekstissä esiintyvät numerot, lyhenteet ja muut ongelmatapaukset niiden lukukelpoisina vastikkeina, jotta syntetisaattori osaisi lukea ne oikein.

Emacspeakiin lisättiin tuki suomenkieliselle Festival-synteesille, joka perustuu hyvin alkeellisen espeakf-nimisen koodinpätkään. (espeakf:n koodista tuli myöhemmin kehittyneempi versio, jota ei siis hyödynnetty.) Tämä osa on astetta niuhomman GPL-lisenssin alaisuudessa. Yhteensopivuus Emacspeakin nykyisen version kanssa on kysymysmerkki.