Yliopiston etusivulle In English
Helsingin yliopisto
clt131: Tekstityökalut - kevät 2009

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 29307

Kurssin yleiset materiaalit

Tälle sivustolle on kerätty kurssia tukevia linkkejä. Luentokalvot ja tehtävät löytyvät yksityisistä materiaaleista sitä mukaa kun kurssi etenee. Ongelmatilanteissa kannattaa luonnollisestikin etsiä lisätietoa googlaamalla tai man-sivuja lukemalla. Mikäli tämäkään ei auta, kannattaa pyytää apua kurssiassistentilta.

Linkkejä

Project Gutenberg, iso verkkoarkisto vapaassa levityksessä olevaa kirjallisuutta usealla eri kielellä. Raakatekstimateriaalia etsiessä Gutenbergistä on hyvä aloittaa.

Egrep for linguists, Nikolaj Lindbergin hyödyllinen dokumentti, josta löytyy paljolti samoja komentoja ja aihepiirejä kuin tällä kurssilla.

Regular-expressions.info, lähestulkoon kaikki mitä haluat tietää säännöllisistä lausekkeista.

Unix for Poets, toinen teksti joka käsittelee pitkälti kurssia koskettavia asioita Unixista.

Edellisen vuoden kurssin materiaalia. Eritoten tutustumisen arvoisia ovat Panu Kalliokosken laatimat Unix-kurssimateriaalit.

Unix for Beginners, hyödyllinen saitti mikäli Unix:n alkeet ovat hieman hakusessa. Eritoten tutustumisen arvoisia kurssin suhteen ovat tutoriaalit 1-4, mutta muihinkin kannattaa tutustua jos halajaa Unix-taitajaksi tulevaisuudessa.

CSC:n korpuslista, corpus-palvelimella saatavilla olevat isot tekstikokoelmat

Command line text editors, tutustumisen arvoinen artikkeli muutamasta Linux-ympäristön tekstieditorista (mukaanlukien nano).

Advanced Bash-Scripting Guide, erittäin pitkä ja kattava hakuteos Bash-skriptaamisesta.

BASH Programming, Bash-skriptaamisen perusasioita sisältävä opas (kohtuullisen hyvä esittely mm. if-else- ja for-rakenteisiin.

TreeTagger output visualisation module, PHP-liittymä TreeTagger-annotoijaan. Syötettävän tekstin määrä on melko rajattu, mutta tästä saa melko hyvän kuvan annotoidusta tekstistä.

Tekstejä

Skriptiesimerkkejä