Mallivastauksia

1. luento

  1. Kirjoita Perl-ohjelma, joka tulostaa saamansa syötteen siten, että siitä on poistettu joka kolmas sana.
  2. Kirjoita Perl-ohjelma, joka tulostaa listan sen saamassa syötteessä esiintyvistä 'nen'- ja 'sen'-päätteisistä sanoista

2. luento

  1. Koodaa aineiston tekstitiedosto niin, että se on aineiston DTD:n mukainen, testattu ja validi. käytä esim Emacsia.
  2. Tee Perl-ohjelma, joka riisuu aineiston XML-tiedostosta XML-koodauksen; poistaa elementit (ja attribuutit) ja muuttaa entiteetit niitä vastaaviksi merkeiksi.
  3. Tee Perl-ohjelma, joka hakee aineiston XML-tiedostosta kaikki henkilönnimet.

3. luento

  1. Tee Perl-ohjelma, joka listaa aineiston XML-tiedostosta kaikki genetiivissä olevat substantiivit.
  2. Tee Perl-ohjelma, joka listaa aineiston XML-tiedoston kaikki yhdyssanojen määriteosat.

4. luento

  1. Tee Perl-ohjelma, joka laskee aineiston XML-tiedoston sanojen type-attribuuttien (sanaluokkien) taajuusjakauman (tieto siitä, kuinka paljon kutakin tyyppiä on aineistossa).
  2. Tee Perl-ohjelma, joka listaa aineiston perusmuodot siten, että kunkin perusmuodon perässä on tieto siitä, kuinka monta erilaista varianttia perusmuodolla on. Saa järjestää varioimisen mukaiseen järjestykseen ja lisätä eri sananmuotojen listan.

5. luento

  1. Tee Perl-ohjelma, joka trigrammi-informaation perusteella kertoo onko syöteteksti pikemminkin suomen- vai englanninkielistä. Ohjelma voi hakea tekstistä esim. viisi yleisintä trigrammia, verrata niitä valmiisiin listoihin ja kertoa kummasta listasta löytyy enemmän osumia. Trigrammilistat tehdään luennolla.
  2. Tee Perl-ohjelma, joka tulostaa XML-tiedostossa samassa virkkeessä esiintyvät kahden sanan yhdistelmät yleisyysjärjestyksessä. Käytä sanojen perusmuotoja.

6. luento

  1. Tee Perl-ohjelma, joka hakee aineiston XML-tiedostosta substantiivit etumääreineen. Heti substantiivia edeltävät adjektiivit ja genetiivit riittävät.
  2. Kirjoita kurssipalaute, jossa arvioit mitä olet oppinut ja esität perusteltua kritiikkiä.