INDO-EUROOPPALAISTEN KIELTEN KORPUKSET

latina, kreikka, osseetti, tadzhikki , kurmandzhi (eteläkurdi), englanti, saksa, jiddish, ruotsi, venäjä ja ukraina

Indoeurooppalaisten kielten meta-kuvaukset



Latinan korpus



Osseetin korpus

Hakemisto /corp/iranian-lgs/ossete/ sisältää alihakemistot /Bible-of-Children/, /Books-of-Children/ ja /New-Testament/.

Alihakemistossa /Bible-of-Children/ on seuraava dokumentti:

Alihakemisto /Books-of-Children/ sisältää seuraavan dokumentin:

Alihakemistossa /New-Testament/ on seuraava dokumentti:

Nämä sähköisessä muodossa olevat osseetin tekstit on saatu lahjoituksena Raamatunkäännösinsitituutilta (Tukholma) käytettäväksi materiaalina kielentutkimuksessa. Korpusten alkuperä on mainittava kaikissa niissä töissä, joissa niitä on käytetty tutkimusaineistona. Lisätietoja korpuksesta voi tiedustella korpuksen toimittajalta.

Osseetin korpuksen meta-kuvaus

Tadzhikin korpus

Hakemisto /corp/iranian-lgs/tajik/ sisältää seuraavat alihakemistot:

Alihakemistossa /Bible-of-Children/ on seuraava tekstiaineisto:

Alihakemistossa /Books-of-Children/ on seuraava dokumentti:

Tadzhikin korpus on saatu lahjoituksena Raamatunkäännösinstituutilta (Tukholma) käytettäväksi kielentutkimuksen materiaalina. Korpuksen alkuperä on mainittava kaikissa niissä töissä, joissa sitä on käytetty lähdemateriaalina. Lisätietoja korpuksesta saa korpuksen toimittajalta.

Tadzhikin korpuksen meta-kuvaus

Kurdin (kurmandzhin) korpus

Hakemisto /corp/iranian-lgs/kurdish/ sisältää alihakemiston /corp/iranian-lgs/kurdish/New-Testament/. Hakemistossa /New-Testament/ seuraava latinalaisella ja kyrillisellä aakkostolla laadittu dokumentti:

Kurdin korpus on saatu lahjoituksena Raamatunkäännösinstituutilta (Tukholma) käytettäväksi aineistona kielentutkimuksessa. Korpuksen alkuperä on mainittava kaikissa niissä dokumenteissa, joissa sitä on käytetty lähdemateriaalina. Lisätietoja kurdin korpuksesta voi tiedustella korpuksen toimittajalta.

Kurdin korpuksen meta-kuvaus

Englannin korpukset

Helsingin yliopiston tietokonekorpuspalvelimessa (UHLCS) on seuraavat englannin kielen korpukset:

Korpukset, jotka sijaitsevat Helsingin yliopiston tietokonekorpuspalvelimessa, ovat käytettävissä tutkimuksessa ja opetuksessa. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpuksia on käytetty lähdemateriaalina. Lisätietoja englannin korpuksista voi tiedustella korpusten toimittajalta

Englannin korpusten meta-kuvaukset.



Saksan korpus

Saksan korpus sisältää saksalaisesta kirjallisuudesta. Helsingin yliopiston tietokonekorpuspalvelimessa olevat korpukset on tarkoitettu käytettäväksi tutkimusmateriaalina. Korpusten alkuperä on mainittava kaikissa niissä dokumenteissa, joissa niitä on käytetty lähdeaineistona. Lisätietoja saksan korpuksesta voi tiedustella korpusten hallinnolta.

Saksan korpuksen meta-kuvaus



Jiddishin korpus

Hakemisto /corp/yiddish/ sisältää alihakemiston /yiddish-texts/, jossa on seuraavat tekstiaineistot:

Jiddishin korpuksen on Helsingin yliopiston yleisen kielitieteen laitokselle toimittanut Jussi Karlgren käytettäväksi tutkimusaineistona. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty tutkimusmateriaalina. Lisätietoja jiddishin korpuksesta voi tiedustella korpuksen HREF="http://www.ling.helsinki.fi/uhlcs/contacts/fcontacts-12.html">toimittajalta.

Jiddishin korpuksen meta-kuvaus



Ruotsin korpukset

Helsingin yliopiston tietekonekorpuspalvelin (UHLCS) sisältää seuraavat ruotsin kielen aineistot:

  1. Suomen-ruotsin korpus (the Finland Swedish corpus):
    Korpus on valmistettu 1990-luvun alkupuolella Mirja Saaren johtamassa hankkeessa (http://www.nord.helsinki.fi/press.html). Lisätietoja korpuksesta voi tiedustella korpuksen hallinnolta
  2. Ruotsin tekstikorpus (the Swedish text corpus):
    Korpus koostuu ruotsinkielisistä teksteistä, on useissa eri formaateissa (ks. alla "Morfologisesti analysoitu ruotsin tekstikorpus").
  3. Morfologisesti analysoitu ruotsin tekstikorpus (the tagged Swedish Text Corpus):
    Korpus on analysoitu TWOL-ohjelmalla 1990-luvun alkupuolella. Korpus on ASCII-muodossa.

Lisätietoja ruotsin tekstikorpuksista voi tiedustella korpusten hallinnolta

Helsingin yliopiston tietokonekorpuspalvelimella (UHLCS) olevat korpukset on tarkoitettu tutkimus- ja opetuskäyttöön. Korpusten lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpuksia on käytetty lähdeaineistoina.

Ruotsin korpusten meta-kuvaukset



Venäjän korpukset

Helsingin yliopiston tietokonekorpuspalvelimessa (UHLCS) sijaitsee seuraavat venäjän kielen sähköisessä muodossa olevat aineistot:

  1. Venäjän kirjallisuuden korpus (the Fowler Database)
    Korpus sisältää alkuperäistä venäläistä kaunokirjallisuutta sekä venäjänkielistä käännöskirjallisuutta. Korpuksesta on saatavilla eri formaatteja.
  2. Venäjän aikakauskirjallisuuden tietokanta (the Russian Magazine Database ): Tietokanta sisältää artikkeleita, jotka on julkaistu aikakauslehdissä Novoe Vremja, Ogonek ja Sputnik.
  3. Ryscard-tietokanta (the Russian Ryscard Database):
    Ryscard-tietokanta koostuu Uppsalan yliopistossa laadituista korpuksista. Korpus on useissa eri formaateissa.
  4. Venäjän aikakauslehti-korpus (the Russian Corpus of Newspaper Articles):
    Venäjän aikakauslehti-korpuksen toimittaja on Lingsoft Oy (Jyri Sooberg).
  5. Venäjän kielen Uppsala-tietokanta(he Russian Uppsala Database):
    Korpuksessa olevat aineistot on alkujaan laadittu Uppsalan yliopistossa. Korpuksia on työstetty edelleen Helsingin yliopiston yleisen kielitieteen laitoksella. Korpuksesta on saatavilla eri formaatteja.

Helsingin yliopiston tietokonekorpuspalvelimella (UHLCS) olevat korpukset on tarkoitettu käytettäväksi lähdeaineistona tutkimuksessa ja opetuksessa. Korpusten lähdetiedot on mainittava kaikissa niissä töissä, missä korpuksia on käytetty lähdemateriaalina. Lisätietoja venäjän korpuksista voi tiedustella toimittajalta.

Venäjän korpusten meta-kuvaukset



Ukrainan korpus

Hakemistossa /corp/ukrainian oleva ukrainan korpus sisältää seuraavan dokumentin:

    "Jesus Friend of Children" in the Ukrainian language
    Arapovich, Borislav & Mattelmäki, Vera (eds.).
    ISBN 91-88394-61-1. 65 pp.
    Institute for Bible Translation.
    Stockholm 1995.

Ukrainan tekstikorpuken on Helsingin yliopiston yleisen kielitieteen laitokselle lahjoittanut Raamatunkäännösinstituutti (Tukholma) käytettäväksi tutkimusmateriaalina. Korpuksen alkuperä on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty lähdeaineistona. Lisätietoja korpuksesta voi tiedustella korpuksen toimittajalta.

Ukrainan korpuksen meta-kuvaus


University of Helsinki Language Corpus Server


P.S., 1996, Rev. July 16,1998; 2002; 2007.