Kursplan för fortsättningskurs i språkteknologi (Ctl270), 2ov:

"Data structures and algorithms in computational linguistics"
"Tietokonelingvistiikan tietojenkäsittelymenetelmät"
"Datastrukturer och algoritmer i datorlingvistik"

Björn Gambäck
Jussi Karlgren

Mottagning

Mottagning efter överenskommelse eller torsdagar 14-15. Kontaktinfo.


Kurslitteratur

Fullständiga referenser och läsanvisningar.

Examination

Kurskrav och förteckning över vilka studenter som godkänts på vilka kursmomemt.

Föreläsningsplan

Föreläsningar torsdagar och fredagar 12-14 i föreläsningssalen.
Laborationshandledning torsdagar och fredagar 14-15 i Unixsalen.

 1. To 21 januari JK

 2. Introduktion. Parsningsbegreppet.
  Top down-parsning & bottom up-parsning.
  Knep för bättre parsning: Länktabeller, wfst.
  Huvudet-först-parsning.

  Grammatisk komplexitet.

  Laboration 1.1: Enkla grammatiker, top down- och bottom
  Laboration 1.2: Wfst, länk- och huvudet-först-parsning.
  Laboration 1.3: Chart- eller shift-reduce-parsning.

 3. F 22 januari JK

 4. Statistiska metoder.

  Laboration 1, forts.

 5. To 28 januari BG

 6. Chartparsning & Earleys algoritm.
  Shift-reduce-parsning.
  LR-parsning introduktion: Verktygen lex och yacc.

  Laboration 2.1: lex och yacc.
  Laboration 2.2: Parsningsutvärdering.
  Laboration 2.3: LR-parsning.

 7. F 29 januari BG

 8. Mer om shift-reduce och LR-parsning.
  LR-parsning och packning: Tomitas algoritm.

  Inlämningsuppgift 1: LR-parsning
  Laboration 2, forts.

 9. OBS! Ti 2 februari JK, 16-18 i mötesrummet OBS!

 10. Datastrukturer för ordlistor: listor, hashtabeller, träd, ändliga automater.
  Laboration 3.1: n-gramextraktion eller ordlistor, 1.
  Laboration 3.2: n-gramextraktion eller ordlistor, 2.
  Laboration 3.3: n-gramextraktion eller ordlistor, 3.

 11. To 4 februari JK

 12. Datastrukturer för indexering.
  Längdnormalisering.
  Matchningsalgoritmer.
  Latent Semantic Indexing.
  Vägning av flera kunskapskällor.

  Laboration 3, forts.

 13. To 11 februari BG

 14. Semantik och kunskapsrepresentation.

 15. F 12 februari BG

 16. Maskininlärningsmetoder.
  Generering.

  Inlämningsuppgift 2: Tentafrågor

 17. F 19 februari JK

 18. Skriftlig tentamen, 12-15 i institutionens föreläsningssal.


Sidansvarig: Björn Gambäck (gamback@ling.helsinki.fi)
Senast ändrad Fri Feb 12 14:20:16 EET 1999