Aineisto - korpukset: mikä ja millainen on korpus

Korpus on (yleensä) joltinenkin määrä juoksevaa tekstiä jota käytetään kielitieteellisen tutkimuksen havaintomateriaalina. Vrt. informantit ja introspektio.

Tutkimuksen aineistoksi valittu kokoelma kielenainesta (Perussanakirja)

Tekstipankki - tutkimuksen pohjaksi koottu konelukuinen aineisto (viitataan usein sanalla korpus); tekstiarkisto - sähköiseen muotoon tallennettuja tekstejä (esim FTP-palvelimet etc.).

Korpusten lukittelua (Lehtinen etc.)

Eri tapoja luokitella korpuksia

Korpusten tyypittely (Teubert)

Tekstityypit

SEURAAVA>>