Yliopiston etusivulle Suomeksi
Helsingin yliopisto
clt131: Korpusten käsittely - syksy 2005

Yhteystiedot:

Osoite:
Yleisen kielitieteen laitos
PL 9
Siltavuorenpenger 20A
00014 Helsingin yliopisto

Puhelin: +358 (09) 1911 (vaihde)
Faksi: +358 (09) 191 29307

Kurssikuvaus

Esitiedot:

  • Kieliteknologian ATK-ympäristön tuntemus, esim. kurssin Clt130 laajudessa

Tavoitteet:

  • Oleellisten asioiden poiminen isosta tekstimassasta (korpuksesta) eli aineiston keruu
  • Aineiston muokkaaminen ihmiselle tai tietokoneohjelmalle helpommin tulkittavaan muotoon

Kurssin sisältö:

  • Tietokonemuotoisten tekstiaineistojen luominen ja muokkaaminen
  • Emacs-editorin käyttöä
  • Tekstin poimiminen ja muokkaaminen Unixin komentojen avulla
  • Komentosarjat
  • Säännölliset lausekkeet
  • Puhesignaalin visualisointi
  • Tekstin normalisointi, sanamuotojen frekvenssit, konkordanssi
  • Kieliaineistojen esittelyä
  • Morfologisia ja syntaktisia työkaluja

Kirjallisuus:

Kurssin laajuus opintoviikkoina:
3 op
HY:n opintosuoritusrekisterin koodi:

Opetus

Opettaja:
FM Nicholas Volk
Suoritustapa:
Luennot ja harjoitukset
Paikka ja aika:
II periodi, Siltavuorenpenger 20A (unix-luokka, 3. krs), suunnilleen ti 9-12
Ilmoittautuminen:

Sähköpostilla luennoitsijalle (nvolk@ling.helsinki.fi, ks. ensimmäisten laskuharjoitusten ensimmäinen tehtävä)

Kurssimateriaali:
Kurssilla käytetyt kalvot ym. www-materiaali. Ks. "Yleiset materiaalit"