Yliopiston etusivulle Suomeksi
Helsingin yliopisto
clt131: Korpusten käsittely - syksy 2006

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 Helsingin yliopisto

Puhelinvaihde +358 (09) 1911
Faksi +358 (09) 191 29307

Kurssikuvaus

Tilanne 9.1.2006

 • Joitain tehtäviä vielä arvostelematta. Yritämme saada tulokset rekisteriin lähiaikoina. Jos tarvitset arvosanan heti, ota yhteyttä.
 • Laajennukset luettu (MK, JT, LV, MW). Jos nimikirjaimesi puuttuvat listasta, ota yhteyttä!

Esitiedot ja edellykset:

 • Unix-käyttöjärjestelmän käytön perusteet esim. kurssin Kieliteknologian ATK-ympäristö (clt130) laajuudessa.
 • Lisäksi vaaditaan myös pääsy jollekin Unix- tai Linux-koneelle, jolla kurssilla annettavat harjoitukset voi suorittaa. (Harjoitukset voi suorittaa myös Cygwiniä käyttämällä.) Laitoksen ATK-käyttöluvista enemmän osoitteessa http://www.ling.helsinki.fi/atk/palvelut/luvat.shtml .

Tavoitteet:

 • Kyetä poimimaan isosta tekstiaineistosta oman tutkimusongelman kannalta oleelliset rivit
 • Kyetä muokkaamaan tekstiaineistoja kulloiseenkin tarkoitukseen sopivaan muotoon

Kurssin sisältö:

 • One-linereiden käyttö Unixin komentoriviltä, erityisesti "putkitus"
 • Yksinkertaisten skriptien laatiminen Emacs-editorilla
 • Merkkijonojen muokkaaminen ja poiminen
 • Säännölliset lausekkeet
 • Frekvenssilistojen ja yksinkertaisen konkordanssin laatiminen
 • Kielitieteellisten ohjelmien ja aineistojen esittelyä

Kirjallisuus:

 • Ei kurssikirjaa

Opetus

Opettaja:

 • FM Nicholas Volk

Kurssiassistentti:

 • fil.yo. Roope Havu

Suoritustapa:

 • HY:n opiskelijat: täsmentyy myöhemmin
 • KIT-verkoston opiskelijat voivat suorittaa kurssin verkkokurssina palauttamalla harjoitukset määräaikaan mennessä sähköpostitse kurssiassistentille

Paikka ja aika:

 • Siltavuorenpenger 20A (unix-luokka, S20A 3. krs), II periodi 3.11.-15.12.

Ilmoittautuminen:

 • Sähköpostitse kurssiassistentille ensimmäisten laskuharjoitusten palautuksen yhteydessä

Kurssimateriaali:

 • Kurssin verkkomateriaali