INDO-EUROOPPALAISTEN KIELTEN KORPUKSET

latina, kreikka, osseetti, tadzhikki , kurmandzhi (eteläkurdi), englanti, jiddish, ruotsi, venäjä ja ukraina

Indoeurooppalaisten kielten meta-kuvaukset



Kreikan korpus

Lisätietoja korpuksesta voi tiedustella korpuksen toimittajalta.



Latinan korpus

Lisätietoja korpuksesta voi tiedustella korpuksen toimittajalta.



Osseetin korpus

Hakemisto /corp/iranian-lgs/ossete/ sisältää alihakemistot /Bible-of-Children/, /Books-of-Children/ ja /New-Testament/.

Alihakemistossa /Bible-of-Children/ on seuraava dokumentti:

Alihakemisto /Books-of-Children/ sisältää seuraavan dokumentin:

Alihakemistossa /New-Testament/ on seuraava dokumentti:

Nämä sähköisessä muodossa olevat osseetin tekstit on saatu lahjoituksena Raamatunkäännösinstituutilta (Tukholma) käytettäväksi materiaalina kielentutkimuksessa. Korpusten alkuperä on mainittava kaikissa niissä töissä, joissa niitä on käytetty tutkimusaineistona. Lisätietoja korpuksesta voi tiedustella korpuksen toimittajalta.

Osseetin korpuksen meta-kuvaus

Tadzhikin korpus

Hakemisto /corp/iranian-lgs/tajik/ sisältää seuraavat alihakemistot:

Alihakemistossa /Bible-of-Children/ on seuraava tekstiaineisto:

Alihakemistossa /Books-of-Children/ on seuraava dokumentti:

Tadzhikin korpus on saatu lahjoituksena Raamatunkäännösinstituutilta (Tukholma) käytettäväksi kielentutkimuksen materiaalina. Korpuksen alkuperä on mainittava kaikissa niissä töissä, joissa sitä on käytetty lähdemateriaalina. Lisätietoja korpuksesta saa korpuksen toimittajalta.

Tadzhikin korpuksen meta-kuvaus

Kurdin (kurmandzhin) korpus

Hakemisto /corp/iranian-lgs/kurdish/ sisältää alihakemiston /corp/iranian-lgs/kurdish/New-Testament/. Hakemistossa /New-Testament/ seuraava latinalaisella ja kyrillisellä aakkostolla laadittu dokumentti:

Kurdin korpus on saatu lahjoituksena Raamatunkäännösinstituutilta (Tukholma) käytettäväksi aineistona kielentutkimuksessa. Korpuksen alkuperä on mainittava kaikissa niissä dokumenteissa, joissa sitä on käytetty lähdemateriaalina. Lisätietoja kurdin korpuksesta voi tiedustella korpuksen toimittajalta.

Kurdin korpuksen meta-kuvaus

Englannin korpukset

Helsingin yliopiston tietokonekorpuspalvelimessa (UHLCS) on useita laajoja englannin kielen korpuksia. Korpukset, jotka sijaitsevat Helsingin yliopiston tietokonekorpuspalvelimessa, ovat käytettävissä tutkimuksessa ja opetuksessa. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpuksia on käytetty lähdemateriaalina. Lisätietoja englannin korpuksista voi tiedustella korpusten toimittajalta

Englannin korpusten meta-kuvaukset.



Jiddishin korpus

Jiddishin korpus koostuu näytteistä jiddishinkielisistä teksteistä. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty tutkimusmateriaalina.



Ruotsin korpukset

Helsingin yliopiston tietokonekorpuspalvelin (UHLCS) sisältää seuraavat ruotsin kielen aineistot:

  1. Suomenruotsin korpus: lisätietoja korpuksesta voi tiedustella korpuksen hallinnolta

Helsingin yliopiston tietokonekorpuspalvelimella (UHLCS) olevat korpukset on tarkoitettu tutkimus- ja opetuskäyttöön. Korpusten lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpuksia on käytetty lähdeaineistoina.

Ruotsin korpusten meta-kuvaukset



Venäjän korpukset

  1. Fowler-korpus:
    Venäjän kirjallisuuden korpus (Fowler Russian data base)
    Korpus sisältää sekä alkuperäistä venäläistä kaunokirjallisuutta että venäjänkielistä käännöskirjallisuutta. Korpus on saatavilla eri formaateissa. Korpuksen sgml-formaatti on laadittu Helsingin yliopiston yleisen kielitieteen laitoksella. (Lisätietoja korpuksesta)
  2. Tampere-korpus:
    Tampere-korpus koostuu venäläisistä aikakauslehdistä vuosilta 1999 ja 2000 kootuista teksteistä. Korpus on laadittu Tampereen yliopistossa kieli- ja käännöstieteiden laitoksella, venäjän kielen ja kulttuurin osastossa. Tekstejä on toimitettu myös Helsingin yliopiston yleisen kielitieteen laitoksella. Tekstit on analysoitu morfologisesti. Osa teksteistä on translitteroitu latinalaiselle aakkostolle.
  3. Puhutun kielen korpus:
    Puhutun kielen korpus, jonka alkuperäiset aineistot ovat peräisin Moskovan Akatemian Kieli-instituutista, on koodattu sgml-formaattiin Helsingin yliopiston yleisen kielitieteen laitoksella.
  4. Venäjän kielen Uppsala-tietokanta(the Russian Uppsala Database):
    Alkuperäinen korpus on laadittu Uppsalan yliopistossa slaavilaisten kielten laitoksella. Korpus on kuvattu yksityiskohtaisesti korpuksen kotisivuilla Uppsalan yliopistossa. Korpuksia on työstetty edelleen Helsingin yliopiston yleisen kielitieteen laitoksella. Lupa korpuksen käyttöön UHLCS:ssa on saatu korpuksen omistajilta Ingrid Maierilta (Uppsala) ja Lennart Lönngreniltä (Tromssa).
(in preparation)

Helsingin yliopiston tietokonekorpuspalvelimella (UHLCS) olevat korpukset on tarkoitettu käytettäväksi lähdeaineistona tutkimuksessa ja opetuksessa. Korpusten lähdetiedot on mainittava kaikissa niissä töissä, missä korpuksia on käytetty lähdemateriaalina. Venäjän korpusten meta-kuvaukset



Ukrainan korpus

Hakemistossa /corp/ukrainian oleva ukrainan korpus sisältää seuraavan dokumentin:

    "Jesus Friend of Children" in the Ukrainian language
    Arapovich, Borislav & Mattelmäki, Vera (eds.).
    ISBN 91-88394-61-1. 65 pp.
    Institute for Bible Translation.
    Stockholm 1995.

Ukrainan tekstikorpuksen on Helsingin yliopiston yleisen kielitieteen laitokselle lahjoittanut Raamatunkäännösinstituutti (Tukholma) käytettäväksi tutkimusmateriaalina. Korpuksen alkuperä on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty lähdeaineistona. Lisätietoja korpuksesta voi tiedustella korpuksen toimittajalta.

Ukrainan korpuksen meta-kuvaus


University of Helsinki Language Corpus Server


P.S., 1996, Rev. July 16,1998; 2002; 2007.