Kieliteknologian oppiaine

Puhekorpusten käsittely: Vfo254 kevät 2003

- KIT-verkosto | Yleisen kielitieteen laitos | Helsingin Yliopisto -
Kurssin sivut
Kurssin kalenteri
Kurssin materiaali
Postia opettajalle
Kurssin kuvaus

Kurssin materiaali

Luentokalvot:

Ensimmäisen luennon kalvot. Toisen luennon kalvot. Kolmannen luennon kalvot. Stefan Wernerin kalvot prosodian transkripoimisesta.

Puhedataa:

Pieni korpus wav-muodossa. Pieni praat-muodossa annotoitu tietokanta:

Muuta:

Suomen worldbet-aakkosto (postscript muodossa).

Lopputehtävät:

  • 1. Omat keskustelut nimikoidaan valmiiksi: jos keskustelusta on automaattinen segmentaatio, käytetään sitä pohjana. Jos ei ole automaattista segmentointia, segmentoidaan ainakin sanat ja niistä vokaalit [a] ja [i]. Samoin kaikista keskusteluista segmentoidaan ilmausten loput (ks. tehtävä 3).
  • 2. Tee praatin avulla formanttikartat a- ja i-vokaaleista ja kirjoita pieni tutkielma niiden vaihtelusta -- vertaa vaihtelun määrää kurssin alussa jaettuun tietokantaan.
  • 3. Merkitse omiin keskusteluihisi äänenlaadun vaihtelut (narina, soinnittomuus) sekä erilaiset glottalisaatiot ja vapautumattomuudet (ts. glottaaliklusiilit ja eksploosiottomat klusiilit). Kirjoita pieni tutkielma, jossa selvität miten yllä mainitut ilmiöt korreloivat vuoronvaihtojen kanssa.

Tutkielmat palautetaan paperilla opettajalle 31.3 mennessä -- TextGridit palautetaan sähköpostitse. Lisäaikaa saa pyydettäessä.

Alkuun