Kursplan för fortsättningskurs i språkteknologi (Ctl270), 2ov:

"Data structures and algorithms in computational linguistics"
"Tietokonelingvistiikan tietojenkäsittelymenetelmät"
"Datastrukturer och algoritmer i datorlingvistik"

Björn Gambäck
Jussi Karlgren

Mottagning

Mottagning efter överenskommelse eller torsdagar 14-15. Kontaktinfo.


Kurslitteratur

Fullständiga referenser och läsanvisningar.

Examination

Kurskrav och förteckning över vilka studenter som godkänts på vilka kursmomemt.

Föreläsningsplan

Föreläsningar torsdagar och fredagar 12-14 i föreläsningssalen.
Laborationshandledning torsdagar och fredagar 14-15 i Unixsalen.

  1. To 21 januari JK

  2. Introduktion. Parsningsbegreppet.
    Top down-parsning & bottom up-parsning.
    Knep för bättre parsning: Länktabeller, wfst.
    Huvudet-först-parsning.

    Grammatisk komplexitet.

    Laboration 1.1: Enkla grammatiker, top down- och bottom
    Laboration 1.2: Wfst, länk- och huvudet-först-parsning.
    Laboration 1.3: Chart- eller shift-reduce-parsning.

  3. F 22 januari JK

  4. Statistiska metoder.

    Laboration 1, forts.

  5. To 28 januari BG

  6. Chartparsning & Earleys algoritm.
    Shift-reduce-parsning.
    LR-parsning introduktion: Verktygen lex och yacc.

    Laboration 2.1: lex och yacc.
    Laboration 2.2: Parsningsutvärdering.
    Laboration 2.3: LR-parsning.

  7. F 29 januari BG

  8. Mer om shift-reduce och LR-parsning.
    LR-parsning och packning: Tomitas algoritm.

    Inlämningsuppgift 1: LR-parsning
    Laboration 2, forts.

  9. OBS! Ti 2 februari JK, 16-18 i mötesrummet OBS!

  10. Datastrukturer för ordlistor: listor, hashtabeller, träd, ändliga automater.
    Laboration 3.1: n-gramextraktion eller ordlistor, 1.
    Laboration 3.2: n-gramextraktion eller ordlistor, 2.
    Laboration 3.3: n-gramextraktion eller ordlistor, 3.

  11. To 4 februari JK

  12. Datastrukturer för indexering.
    Längdnormalisering.
    Matchningsalgoritmer.
    Latent Semantic Indexing.
    Vägning av flera kunskapskällor.

    Laboration 3, forts.

  13. To 11 februari BG

  14. Semantik och kunskapsrepresentation.

  15. F 12 februari BG

  16. Maskininlärningsmetoder.
    Generering.

    Inlämningsuppgift 2: Tentafrågor

  17. F 19 februari JK

  18. Skriftlig tentamen, 12-15 i institutionens föreläsningssal.


Sidansvarig: Björn Gambäck (gamback@ling.helsinki.fi)
Senast ändrad Fri Feb 12 14:20:16 EET 1999