Yliopiston etusivulle Suomeksi
Helsingin yliopisto
clt350: Tilastolliset jäsennysmenetelmät (Statistical Parsing Methods) - (Part 1: Statistical NLP Tools) - syksy 2007

Yhteystiedot

Yleisen kielitieteen laitos
PL 9 (Siltavuorenpenger 20 A)
00014 Helsingin yliopisto

Puhelinvaihde +358 (09) 1911
Faksi +358 (09) 191 29307

Course Materials

Textbook

Topics

  1. Introduction
  2. Information Extraction
    • Tool: GATE (University of Sheffield)
  3. Texts and Tokenization
  4. Linguistic Annotation
  5. Collocations and N-grams
  6. Language Models
  7. Maximum Entropy Models
  8. Part-of-Speech Tagging
  9. Probabilistic Grammars
  10. Probabilistic Parsing
  11. Practical: Training Maximum Entropy Models
  12. Towards Scalability and Interoperability
    • Tool: UIMA (Apache Software Foundation)
© 2007 Graham Wilcock