Yliopiston etusivulle In English
Helsingin yliopisto
clt350: Statistical Parsing Methods - lukuvuosi 2009-2010

Yhteystiedot

Nykykielten laitos

PL 24 (Unioninkatu 40)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 28313

5. Shallow Parsing (Chunking)

5.1. OpenNLP Chunker

  • Practical work
    • Copy the script clt350-opennlp-chunker.sh to your directory and make it executable. This script runs the OpenNLP sentence detector, tokenizer, POS tagger and chunker. It takes input from stdin and sends output to stdout.
    • Use it like this to chunk Sonnet 130:
      ./clt350-opennlp-chunker.sh <sonnet130.txt >chunked130.txt &
    • Note: The Stanford NLP tools do not include a chunker.

5.2. OpenNLP Java Programming

© 2007-2010 Graham Wilcock

Hae laitoksen sivuilta:

Laitoksen etusivulle | Tiedekunnan etusivulle | Yliopiston etusivulle

Copyright © 2003-2005 Helsingin yliopisto. Kaikki oikeudet pidätetään.