Yliopiston etusivulle Suomeksi
Helsingin yliopisto
Suomen HMM-puhesynteesi

Esittely

Helsingin yliopistolla on tutkittu vuodesta 2005 Markovin piilomalleihin (HMM) perustuvaa puhesynteesiä. Kiinnostuksen kohteena on ollut erityisesti ekspressiivisen ja tekstin informaaatiorakenteen huomioon ottavan prosodian mallintaminen lausetta pidempiä tekstiä syntetisoitaessa.

Vuoden 2007 lopusta lähtien on lisäksi tutkittu käänteissuodatuksen käyttöä HMM-synteesissä yhteistyössä TKK:n kanssa. Tähän liittyvä herätteen kunnollinen mallinnus yhdessä HMM-synteesin joustavuuden kanssa avaa oven puheäänen kokonaisvaltaiseen mallinnukseen. Kuiskaaminen ja huutaminen sekä pehmeä ja terävä puhe, emootiot ja eri ihmisten puhetyylit tulevat tutkimuksen kohteeksi.

Tutkimusta ovat rahoittaneet Tekes ja Suomen akatemia.

Teknologia

FDG-jäsennin, Connexor
Käänteissuodatukseen perustuva analyysi-synteesi, TKK
XML - Python esikäsittelijä
HMM-synteesi, Nitech

Puhenäytteet

Seuraavassa esimerkkejä HMM-synteesistämme. Näytteet ovat prosodia mukaanlukien tekstistä automaattisesti tuotettuja. Sanojen painotukset on ennustettu säännöin, automaattisen syntaktisen analyysin avulla.

Naisääni

Naisääni on opetettu vivahteikkaan lukijan jatkuvasta puheesta (n. 2 tuntia), ja sen tuottama prosodia soveltuu hyvin pitkille teksteille. Äänen laatu on kuitenkin selvästi synteettinen, johtuen puheen yksinkertaisesta parametrisoinnista: Soinnillisten äänteiden heräte koostuu yksinkertaisesta impulssijonosta.
Tuliluikku (2.2M)
Pyhesynteesistä (3.3M)
Pärnussa (960k)

Miesääni

Miesääni edustaa tämänhetkistä (2008) tutkimustamme käänteissuodatukseen perustuvasta lähteen mallintamisesta HMM-synteesissä. Tutkimus on vielä alkuvaiheessa, joten näytteet ovat hieman raakoja, mutta puheen laatu on jo selvästi luonnollisempi kuin naisäänellä. Prosodia ei kuitenkaan ole pitkillä teksteillä yhtä sulavaa, koska opetusaineistona on käytetty yksittäisiä erillään luettuja lauseita.
Salakapakka (1.2M)
Hotelleista (503k)
Pärnussa (822k)

Bonus

Poikkitaiteellinen spektaakkeli, jossa synteettinen uutistenlukija taustajoukkoineen ja J.S Bach kohtaavat.
BWV Bataatti (1.8Mb)