Yliopiston etusivulleSuomeksi
Helsingin yliopisto
Ohjeita kurssien sivustojen ylläpitämiseksi - syksy 2004

Yhteystiedot:

Osoite:

Yleisen kielitieteen laitos

PL 9

Siltavuorenpenger 20A

00014 Helsingin yliopisto



Puhelin: +358 (09) 1911 (vaihde)

Faksi: +358 (09) 191 29307

Terminologian ylläpito

Kieliteknologian terminologiaa ylläpidetään useampaa tarkoitusta varten, mm. kurssien ydinainesanalyysin selkärangaksi ja muutenkin kurssien sisällön määrittelyn avuksi. Tällä sivulla kerrotaan ohjeita niille opettajille, jotka sopimuksen mukaisesti osallistuvat tämän terminologian ylläpitämiseen.

Terminologian koostamisen periaatteita

Terminologioita voidaan laatia erilaisilla periaatteilla ja maailmalla onkin erilaisia tyylejä. Tässä hankkeessa on päätetty noudattaa seuraavanlaisa sääntöjä:

  1. Terminologia ankkuroituu käsitteiden (concept) varaan, ei sanojen tai fraasien (term denomination). Jokaisella termillä pitää siten olla yhteisesti ymmärretty käsite, jolle sitten etsitään erikielisiä nimityksiä. Siten ei ole katastrofi, vaikka termin nimitys ei olisi yksiselitteinen. Käsitteiden tulee olla riittävän suppeita, jotta niille voidaan antaa erikieliset vastineet. (Jos eri tapauksissa vastinen olisi erilainen, on käsite määritelty liian laajasti.)
  2. Termin käsite määritellään tai kuvaillaan. Oikeaoppinen määritelmä olisi kai sellainen, että sen voisi sijoittaa tekstissä termin nimityksen paikalle, mutta tässä terminologiassa ei mitenkään vaadita näin oikeaoppisia määritelmiä. Riittää myös, jos kuvailee asiaa muuten siten, että normaali lukija ymmärtää, mitä käsitettä tarkitetaan.
  3. Termit yksilöidään yksiselitteisillä tunnuksilla (attribuutti id), joka muodostetaan normaalisti termin englanninkielisestä nimityksestä sellaisenaan (esim. "adjective") tai korvaamalla sananvälit miinusmerkeillä (esim. "part-of-speech"), jos nimitys koostuu useammasta sanasta. Jos kahdelle termille olisi tulossa täten sama tunnus, lisätään myöhemmin kirjoitetun termin tunnukseen erikoisalaa koskeva loppuliite tms.
  4. Termeille annetaan ainakin englannin- ja suomenkieliset nimitykset (denomination), mutta mielellään myös muunkielisiä, erityisesti ruotsin-, saksan- ja ranskankieliset nimitykset ovat tervetulleita. Termien nimityksiä voi tarvittaessa korjailla ja muutella. Jos samalle asialle on useita nimityksiä, ne voi laitta pilkun erottamina peräkkäin. Vanhentuneita tai ei-toivottuja nimityksiä ei kirjata.

Termitiedoston rakenne

Termitiedostoa ylläpidetään XML-muotoisena tiedostona terms.xml, josta tehdään selattavia versioita, kuten terms-en.shtml ja terms-fi.html ja jonka avulla esim. kurssien ydinainesta kuvattaessa tiedostosta täydennetään tunnuksiin perustuvat lyhyet viitteet. Tiedoston ylläpitomenettelyistä CVS-järjestelmän puitteisa tuonnempana.

Esimerkki yksinkertaisesta termistä:

  <term id="coordination">
    <designation xml:lang="en">coordination</designation>
    <designation xml:lang="fi">rinnastus, koordinaatio</designation>
    <def xml:lang="fi">Kahden samankategoriaisen tai muuten
samanarvoisen rakenteen liittyminen yhteen.</def>
  </term>
    

Termin nimitysten ja termien selitysten kieli ilmaistaan XML:n vakiotavalla eli attribuutilla xml:lang. Selitys on usein pelkkää tekstiä, mutta siihen voidaan mielellään laittaa myös viitteitä toisiin termeihin (ankkuri <a cf="...">...</a>), esim.:

  <term id="morphophonemic-representation">
    <designation xml:lang="en">morphophonemic representation</designation>
    <designation xml:lang="fi">morfofoneeminen esitysmuoto</designation>
    <def>
Erityisesti <a cf="two-level-morphology">kaksitasomorfologiassa</a>
esitysmuoto, joka koostuu <a cf="phoneme">foneemeista</a> ja <a
cf="morphophoneme">morfofoneemeista</a>. Sääntökomponentti suhteuttaa
morfofoneemisen esitysmuodon <a cf="surface-form">pintamuotoon</a>.
Leksikko puolestaan suhteuttaa morfofoneemisen esitysmuodon
kieliopilliseen sanaan.
    </def>
  </term>
    

Lisäksi termin selitykseen voidaan laittaa kirjallisuusviitteitä. Niissä viitataan kirjoihin (tms. lähteisiin), jotka on lueteltu XML-tiedostossa sources.xml, esim.:

  <term id="morph">
    <designation xml:lang="en">morph</designation>
    <designation xml:lang="fi">morfi</designation>
    <designation xml:lang="sv">morf</designation>
    <designation xml:lang="de">Morph</designation>
    <designation xml:lang="fr">morphe</designation>
    <def xml:lang="fi">
<a cf="morpheme" >Morfeemin</a> konkreettinen ilmenemismuoto. Esim.
sananmuodossa "kalastajalle" voidaan erottaa morfit "kala", "-sta",
"-ja", "-lle".  Morfeja, jotka ovat saman morfeemin ilmenemismuotoja,
kutsutaan <a cf="allomorph" >allomorfeiksi</a>.  <ref
src="sproat">Glossary, p. 247.</ref>
    </def>
  </term>
    

Termitiedoston ylläpitomenettelyt

Hakemisto terminology ja siellä olevat tiedostot, kuten terms.xml on talletettuna CVS-järjestelmään, jotta sitä voitaisiin päivittää useammankin tekijän toimesta. CVS on varsin vaativa työkalu ja erityisesti pitää varoa kokeilemasta komentoja, joita tai joiden toimintaa ei tarkalleen tiedä. Alla annetaan ohjeita päivityksen tekemiseksi tietyssä järjestyksessä, jossa on kolme askelta, joista ensimmäinen tehdään vain kerran:

  1. Tehdään CVS:n avulla itselle työhakemisto terminologiaa varten ja haetaan siihen versio tiedostoista (cvs checkout ...), jotta ylläpitoon voidaan ylipäätänsä ryhtyä.
  2. Aina ennen kutakin omaa muutosten tekovaihetta päivitetään oman työhakemiston tilanne siltä varalta, että muut ovat tehneet omia muutoksiaan (cvs update ...).
  3. Editoinnin jälkeen luovutetaan muutokset muidenkin nähtäville (cvs commit ...).

Alla kuvattu menettely toimii (toivottavasti) laitoksen palvelimilla, laajakaistayhteydellä varustetulla Linux-koneella kotona, kannettavalla Linux-koneella laitoksella tai muualla laajakaistayhteyden päässä ja varmaan myös Windowsin alla, kunhan SSH-yhteys on saatavilla. (SSH-yhteyden automatisointi toimimaan ilman salasanaa helpottaa työskentelyä esim. kotona)

Sikäli kun editointijaksot (ja siis updaten ja commitin välinen aika) on lyhyt, vältetään enimmät konfliktit, joita voisi sattua silloin, kun kaksi tekee samaan lähtötiedostoon toisistaan riippumattomia muutoksia.

Alkuunpääsy

Ensinnäkin pitää CVS:ää varten kertoa, että käytetään (tarvittaessa) ssh-yhteyttä (kun rsh on turvattomuutensa takia kielletty) ja että tässä kaytetty arkisto (repository) sijaitsee palvelimellamme koskenni-tunnuksen kotihakemiston cvs-nimisessä alihakemistossa:

    export CVS_RSH=ssh
    export CVSROOT=:ext:omatunnus@venus.ling.helsinki.fi:/home/k/o/koskenni/cvs

Edellä mainittuja komentoja ei tarvitse panna minnekään aloitustiedostoon, koska CVS tietää ensimmäisen latauskerran jälkeen hyvin, missä arkisto sijaitsee. Seuraavaksi pitäisi siirtyä sellaiseen hakemistoon, jonka alihakemistoksi sopii haettava terminology -niminen hakemisto. Sen jälkeen voidaankin hakea työversio itselle:

    cvs checkout terminology

Onnistuessaan komento luettelee haetut tiedostot joita on kymmenkunta.

Ajantasaistus ennen editointikierrosta

Synkronointi on tehtävä aina ennen kuin lähtee muuttelemaan termitiedostoa ja juuri ennen, kuin aikoo lähettää omat lisäyksensä yhteiseen versioon. Se voidaan tehdä joko komentoriviltä:

    cvs update terms.xml

tai sitten Emacsin sisältä, mikä edellyttää sekin varovaisuutta (älä siis sohi, vaan etene tarkistaen ja varmistaen ensin):

  1. Tools -valikosta löytyy PCL-CVS -kohta ja siitä alakohta directory status, joka valitaan (ja annetaan kyseinen terminology -hakemisto). Sen tuloksena aukeaa puskuri, jossa on hakemiston listaus, jossa on tiedostot ja niiden tila.
  2. Vie kohdistin halutun tiedoston kohdalle (siis terms.xml -tiedoston riville) ja valitse ylhäältä CVS -valikosta kohta update, jos tilarivi osoittaa päivityksen tarpeelliseksi. (Jos siinä lukee Up-To-Date, niin mitään ei ole tarpeen tehdä.)

Nyt tiedosto on valmis editoitavaksi. Käytä esim. Emacsia, jonka PSGML-moodi tukee riittävästi käytettyä yksinkertaista XML:ää.

Omien muutosten luovuttaminen toisille

Omat muutokset on varmistettava, ennen kuin niitä lähetetään muille käyttöön. Varmistuksen voi tehdä kahdessa vaiheessa:

  1. Emacsin PSGML-moodissa on komento C-c C-o, joka tekee pintapuolisen tarkistuksen ja vie kursorin siitä, missä se on, seuraavaan virhekohtaan (tai tiedoston loppuun).
  2. Ajamalla komentoriviltä komento make, joka tekee HTML-versiot XML-lähdekoodista. Samalla se jäsentää tiedoston. Jos virheitä ei ilmaannu siinä, tiedosto on ainakin muodollisesti kunnossa.

Juuri ennen luovutusta (commit) on syytä suorittaa uudestaan synkronointi (update), sillä luovutus ei onnistu, jos viimeisen synkronoinnin jälkeen joku muu on tallettanut muutoksia. Varsinainen editoidun version luovutus (commit) tapahtuu yksinkertaisesti samalla komennolla, jolla RCS:ssä tiedosto talletetaan eli C-x v v tai sitten komentoriviltä terminologian hakemistossa

    $ cvs commit

Yliopiston UHL-Linux-jakelussa oleva Emacs näyttäisi olevan niin viritetty, että siinä voi käyttää yllä mainittuja PCL-CVS-pakkauksen komentoja. Näin ei välttämättä ole muulla tavalla ylläpidetyissä Linuxeissa.

Yleisenä ohjeena olkoon se, että luovutus (commit) pitäisi tehdä usein, eikä sitä ole syytä lykätä, vaikka termien laatimista aikoisi jatkaa vaikka seuraavana päivänä.

Ristiin menevät päivitykset

Kun meitä on useampia, jotka tekevät terminologiaan päivityksiä, voi sattua, että kaksi tekee lisäyksiä samaan aikaan omilla tahoillaan. Toinen on tallettanut (commit) muutoksensa ennen, kuin toinen. Kun jälkimmäinen tekee synkronoinnin (update) ennen aikomaansa talletusta (commit), hän saa version, jossa juuri toisen tekemät lisäykset ovat lomitettuna hänen omaan työversioonsa - yleensä aivan oikealla tavalla.

Joskus voisi sattua niinkin, että kaksi tekee muutoksia samaan termiin. Emacsin PCL-CVS -pakkauksessa lienee apuvälineitä konfliktien ratkaisemiseksi EDIFF-toiminnon kaltaisesti (mutta en ole kokeillut).

Päivitetyn terminologian saattaminen näkyville verkkoon

Edellä mainitut tooimenpiteet päivittävät terminologian CVS-arkistossa olevan lähdetiedoston. Julkistamista varten pitää /web/ling/kit/2004s/terminology -hakemistossa oleva versio päivittää (update) ja suorittaa siellä make install -komento.

Hae laitoksen sivuilta:

Sivua muokattu viimeksi:

Copyright © 2003-2004 Helsingin yliopisto. Kaikki oikeudet pidätetään.