TURKKILAISTEN KIELTEN KORPUKSET

azeri, gagauzi, turkmeeni, karatshai-balkaari, bashkiiri, tataari, krimintataari, kirgiisi, uzbekki, uiguuri, saha (jakuutti), tuva, hakassi ja tshuvassi.

Turkkilaisten kielten kuvaukset



Azerin korpus

Hakemisto /corp/turkic-lgs/azerbaijani/ sisältää alihakemiston /New-Testament/, jossa on seuraavat tekstit:

Azerin tekstit on Raamatunkäännösinstituutti (Tukholma) lahjoittanut Helsingin yliopistolle käytettäväksi tutkimusaineistona. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpusta on käytetty lähdemateriaalina. Lisätietoja azerin korpuksesta saa korpuksen toimittajalta.



Gagauzin korpus

Turkkilaisten kielten hakemistossa /corp/turkic-lgs/gagauz/ on alihakemistot /New-Testament/, joka sisältää seuraavat tekstiaineistot:


The Gospel of Luke in the Gagauzian Language.
ISBN 91-88794-30-X, ISBN 5-89116-038-3.
Institute for Bible Translation. Stockholm - Moscow.

Raamatunkäännösinstituutti (Tukholma) on luovuttanut gagauzin tekstikorpuksen Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusmateriaalina. Korpusten lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpuksia on käytetty lähdemateriaalina. Lisätietoja gagauzin korpuksesta saa korpuksen toimittajalta.



Turkmeenin korpus

Turkkilaisten kielten hakemistossa /corp/turkic-lgs/turkmen/ on alihakemistot /New-Testament/ ja /Old-Testament/, jotka sisältävät seuraavat tekstiaineistot:

Raamatunkäännösinstituutti (Tukholma) on luovuttanut turkmeenin tekstikorpuksen Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusmateriaalina. Korpus on toimitettu Unix-käyttöjärjestelmään Helsingin yliopiston yleisen kielitieteen laitoksen rahoituksen turvin. Korpusten lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpuksia on käytetty lähdemateriaalina. Lisätietoja turkmeenin korpuksesta saa korpuksen toimittajalta.



Karatshai-balkaarin korpus

Hakemistossa /corp/turkic-lgs/balkar/ on alihakemisto, joka sisältää karatshai-balkaarin korpuksen. Karatshai-balkarin korpus sisältää seuraavat tekstit:

Raamatunkäännösinstituutti (Tukholma) on luovuttanut karatshai-balkaarin kielen aineistot käytettäväksi tutkimusmateriaalina. Korpus on toimitettu Unix-käyttöjärjestelmään Helsingin yliopiston yleisen kielitieteen laitoksen rahoituksen turvin. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty lähdemateriaalina. Lisätietoja karatshai-balkaarin korpuksesta saa korpuksen
toimittajalta:



Bashkiirin korpus

Hakemisto /corp/turkic-lgs/bashkir/ sisältää alihakemiston /New-Testament/, jossa on seuraavat tekstiaineistot:

Raamatunkäännösinstituutti (Tukholma) on lahjoittanut bashkiirin tekstiaineistot Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusaineistona. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpusta on käytetty lähdemateriaalina. Lisätietoja bashkiirin korpuksesta saa korpusten: toimittajalta.



Tataarin korpus

Hakemisto /corp/turkic-lgs/tatar/ sisältää seuraavat alihakemistot:

Alihakemistossa /New-Testament/ on seuraavat tekstiaineistot:

Alihakemistossa /Books-of-Children/ on seuraavat tekstit:

Raamatunkäännösinstituutti (Tukholma) on lahjoittanut bashkiirin tekstiaineistot Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusaineistona. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpusta on käytetty lähdemateriaalina. Lisätietoja bashkiirin korpuksesta saa korpusten: toimittajalta.



Krimintataarin korpus

Hakemistossa /corp/turkic-lgs/crimean-tatar/ on alihakemisto /New-Testament/, joka sisältää seuraavat tekstiaineistot:

Krimintataarin korpukset on Raamatunkäännösinstituutti (Tukholma) antanut Helsingin yliopistolle käytettäväksi tutkimusaineistona. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpusta on käytetty lähdemateriaalina. Lisätietoja krimintataarin korpuksesta saa korpusten toimittajalta.



Kirgiisin korpus

Hakemisto /corp/turkic-lgs/kirghiz/ sisältää alihakemiston /Books-of-Children/, jossa on seuraavat tekstiaineistot:

Raamatunkäännösinstituutti (Tukholma) on luovuttanut kirgiisin tekstikorpuksen on Raamatunkäännösinstituutti (Tukholma) Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusaineistona. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa korpusta on käytetty lähdemateriaalina. Lisätietoja kirgiisin korpuksesta saa korpusten toimittajalta.



Uzbekin korpus

Hakemisto /corp/turkic-lgs/uzbek/ sisältää seuraavat alihakemistot.

Alihakemisto /Bible-of-Children/ sisältää seuraavat tekstit:

Raamatunkäännösinstituutti (Tukholma) on luovuttanut uzbekin korpuksen Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusaineistona. Lisätietoja korpuksesta saa korpustentoimittajalta.

Alihakemistossa /dictionary/ on uzbekin kielen sanasto. Daniel Kimmage, joka on myös sanaston toimittaja, on antanut sanaston Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusmateriaalina. Lisätietoja sanastosta saa korpuksen toimittajalta.

Korpusten lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa niitä on käytetty lähdeaineistona.



Uiguurin korpus

Hakemisto /corp/turkic-lgs/uighur/ sisältää alihakemiston /New-Testament/, missä on seuraava tekstiaineisto:

Raamatunkäännösinstituutti (Tukholma) on luovuttanut uiguurin tekstikorpuksen Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusaineistona. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty tutkimusmateriaalina. Lisätietoja korpuksesta saa korpuksen toimittajalta.



Hakassin korpus

Hakemistossa /corp/turkic-lgs/khakas/ on seuraavat alihakemistot:

Alihakemisto /Books-of-Children/ sisältää seuraavan dokumentin:

Alihakemisto /New-Testament/ sisältää seuraavan dokumentin:

Raamatunkäännösinstituutti (Tukholma) on luovuttanut hakassin korpuksen Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusaineistona. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty tutkimusmateriaalina. Lisätietoja korpuksesta saa korpuksen toimittajalta.



Tuvan korpus

Hakemistossa /corp/turkic-lgs/tuvin/ on alihakemisto sub-directory /New-Testament/, joka sisältää seuraavan tekstiaineiston:

Raamatunkäännösinstituutti (Tukholma) on luovuttanut tuvan tekstikorpuksen Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusaineistona. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty lähdemateriaalina. Lisätietoja korpuksesta voi tiedustella korpuksen toimittajalta.



Sahan (jakuutin) korpus

Hakemisto /corp/turkic-lgs/yakut/ sisältää alihakemistot /Bible-of-Children/ ja /New-Testament/.

Alihakemisto /Bible-of-Children/ sisältää seuraavan tekstiaineiston:

Alihakemisto /New-Testament/ sisältää seuraavan tekstiaineiston:

Sahan aineistot on Raamatunkäännösinstituutti (Tukholma) antanut Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusmateriaalina. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty tutkimusaineistona. Lisätietoja korpuksesta voi tiedustella korpuksen toimittajalta.



Tshuvassin korpus

Tshuvassin korpus sisältää seuraavat dokumentit:

Tshuvassin korpuksen tekstit on analysoitu ja koodattu morfologisesti sekä käännetty englanniksi ja saksaksi. Korpuksen on laatinut André Hesselbäck hankkeen Uhanalaisten suomalais-ugrilaisten kielten tietopankki. Korpus on toimitettu Helsingin yliopiston yleisen kielitieteen laitokselle käytettäväksi tutkimusmateriaalina. Korpuksen lähdetiedot on mainittava kaikissa niissä toimitteissa, joissa sitä on käytetty tutkimusmateriaalina. Lisätietoja korpuksesta voi tiedustella korpuksen toimittajalta.


Tietokonekorpukset
Computer corpora

P.S., 1996, 1998, 1999, 2007