Harjoitukset 3.3.2003

Palautus viimeistään ma 10.3. Vastaus sisältää sekä lopputuloksen että sen saamiseksi tarvitut käskyt (siis ne ratkaisevat, ei muita yrityksiä ja erehdyksiä). Vastaukset mieluiten raakatekstinä (vastaan nopeammin :) ja komentorivit vastaukset mieluiten osana viestiä, skriptit (pakkaamattomina) liitteinä. Siis mieluiten.

  1. Muokkaa freq.perl-ohjelmaa: huolehdi, että isot ja pienet kirjaimet käsitellään samanarvoisina (kirjainkokoon saa kajota) ja etteivät välimerkit vaikuta lopputulokseen. (Vrt. ykkösluennon kalvot)

  2. Muokkaa freq.perl-ohjelmaa. Esiintymien määrä ei välttämättä ole kovin informatiivinen. Eli lasketaankin määrien sijasta esiintymien prosentuaalinen osuus kaikista sanoista. Tulosta kunkin muodon esiintymistuheys kolmen desimaalin tarkkuudella. Voit tehdä ykkös- ja kakkoslaskarien tehtävät samaan tiedostoon.

  3. Kopioi itsellesi pakattu tiedosto s1.txt.gz ja pura se. Kuinka paljon pienempi pakattu versio on suhteessa pakkaamattomaan? Pakkaa purettu versio bzip2-ohjelmalla. Kumpi on pienempi? Kokeile pakata tiedosto kahteen kertaan (eli pakata pakattu tiedosto toisella pakkauskäskyllä). Miten käy?

  4. Naurettavan helpppo ja keinotekoinen tehtävä, mutta koska käsky on oikeasti hyödyllinen niin antaa mennä: diff-käsky on hyödyllinen vertailtaessa kahta tiedostoa keskenään. Vertailtailemalla kahta tiedostoa nähdään usein toimiiko ohjelmaan tehty korjaus oikein. Tiedostostot a.txt ja b.txt ovat tekemäni tekstin laventimen (puhesyntikan esipalikan) kahden eri version tuotoksia. Niissä pohditaan kuinka syntikan pitäisi lukea tietyt sanat. Etsi tiedostojen eroavaisuudet. Ilmeisesti Internet Exploder haluaa välttämättä avata tiedostot XML-moodissa (joka epäonnistuu puuttuvan DTD-tiedoston takia). Ongelman ratkaisu on tallettaa tiedosto avaamatta sitä (Talleta linkki tai jotain.)

  5. Vuoden 2000 harjoitustehtävä 6. Harjoituksessa mainittu tiedosto löytyy kurssimme rajatun materiaalin hakemistosta. Tässä ei tarvita Perliä, saa kyllä käyttää. Kahden tehtävän arvoinen tehtävä!

nvolk@ling.helsinki.fi
Viimeksi päivitetty: Monday, 03-Mar-2003 11:13:14 EET