Yliopiston etusivulle Suomeksi
Helsingin yliopisto
clt131: Korpusten käsittely - syksy 2005

Yhteystiedot:

Osoite:
Yleisen kielitieteen laitos
PL 9
Siltavuorenpenger 20A
00014 Helsingin yliopisto

Puhelin: +358 (09) 1911 (vaihde)
Faksi: +358 (09) 191 29307

Kurssikuvaus

Esitiedot:

 • Kieliteknologian ATK-ympäristön tuntemus, esim. kurssin Clt130 laajudessa

Tavoitteet:

 • Oleellisten asioiden poiminen isosta tekstimassasta (korpuksesta) eli aineiston keruu
 • Aineiston muokkaaminen ihmiselle tai tietokoneohjelmalle helpommin tulkittavaan muotoon

Kurssin sisältö:

 • Tietokonemuotoisten tekstiaineistojen luominen ja muokkaaminen
 • Emacs-editorin käyttöä
 • Tekstin poimiminen ja muokkaaminen Unixin komentojen avulla
 • Komentosarjat
 • Säännölliset lausekkeet
 • Puhesignaalin visualisointi
 • Tekstin normalisointi, sanamuotojen frekvenssit, konkordanssi
 • Kieliaineistojen esittelyä
 • Morfologisia ja syntaktisia työkaluja

Kirjallisuus:

Kurssin laajuus opintoviikkoina:
3 op
HY:n opintosuoritusrekisterin koodi:

Opetus

Opettaja:
FM Nicholas Volk
Suoritustapa:
Luennot ja harjoitukset
Paikka ja aika:
II periodi, Siltavuorenpenger 20A (unix-luokka, 3. krs), suunnilleen ti 9-12
Ilmoittautuminen:

Sähköpostilla luennoitsijalle (nvolk@ling.helsinki.fi, ks. ensimmäisten laskuharjoitusten ensimmäinen tehtävä)

Kurssimateriaali:
Kurssilla käytetyt kalvot ym. www-materiaali. Ks. "Yleiset materiaalit"