Terminologian luennot

Lauri Carlson

Luento 6: Terminografia

Käytän tässä termiä terminografia SFS:n sanastotyön käsikirjan mukaisesti viittaamaan terminologian esittämiseen sanastossa. Joiltakin osin perinteinen terminografia on vanhettumassa elektronisten sanastojen mukana. Tämä koskee erityisesti niitä osuuksia, joissa on puhe sanaston toimittamisesta kirjaksi: eri osien sijoittelusta sivulle ja kansien väliin, painoasusta jne.

Tässä jaksossa käsitellään erityisesti terminologisen tiedon esittämistä tietokannan muodossa: mikä on termitietueen rakenne, miten sen eri osat riippuvat toisistaan, ja miten tietojen tallentaminen tietokantana ja niiden esittäminen käyttäjälle suhtautuvat toisiinsa.

Termipankissa talletettavat tiedot voi ensi kädessä jakaa niiden tietotyypin perusteella. Tämä on sikäli perusteltua, että se, mitä tiedoilla tehdään, riippuu siitä, tai kääntäen ratkaisee sen, mikä niiden tietotyyppi on. Tietotyyppejä ovat mm:
 
vapaa teksti vapaa teksti on mielivaltaisen pitkä merkkijono, joka voi olla muotoiltu miten vain. Toisaalta vapaa teksti ei aina ole indeksoitu hakua varten, ts. haku ja päivitys vapaassa tekstikentässä voi olla hidasta, vaikeaa tai mahdotonta.
indeksoitu teksti indeksoitu tekstikenttä on tekstikenttä, johon voi kohdista tehokkaita hakuja ja päivityksiä. Indeksoidun tekstikentän pituus on yleensä rajoitettu.
päiväys päiväyskenttä on määrämuotoinen kenttä, jota voi lukea ja tulostaa eri muodoissa päiväykseksi tulkittuna ja jonka suhteen voi suorittaa kalenterivertailuja ja laskutoimituksia.
numero numerokenttä on yleensä rajoitetun pituinen määrämuotoinen kenttä, jonka suhteen voi suorittaa numeerisia vertailuja ja laskutoimituksia.
luettelo luettelokenttä on kenttä, jolla on etukäteen (tietokannan määrittelyssä) kiinnitetty joukko mahdollisia arvoja, joista käyttäjä valitsee.
viite viitekenttä on kenttä, joka viittaa johonkin toiseen tietueeseen tai kenttään. 

 

MultiTerm

Tradosin MultiTerm for Windows-ohjelman termitietue on käsitelähtöinen, toisin sanoen, kutakin käsitettä kohden on yksi tietue, johon liittyvät kaikki kyseistä käsitettä nimeävät termit.

MultiTermin termitietueessa on seuraavanlaisia tietoja:

1. Entry Header Fields. Hallintatietoja ovat
 
Creation Date luontipäiväys järjestelmäkenttä
Created By luoja järjestelmäkenttä
Change Date muutospäiväys järjestelmäkenttä
Changed By muuttaja järjestelmäkenttä
Entry Number tietueen numero järjestelmäkenttä
Graphic  kuvatiedosto  
Entry Class suojaustaso  

2. Database Fields. Tietokantatietoja on kolmea tyyppiä:
 
Index Fields kenttä, johon liittyy hakemisto. English, German
Text Fields tekstikenttä Definition, Note
Attribute Fields etukäteen määriteltävä attribuutti-arvopari Subject=Computers, Company=IBM

MultiTermin tietokantarakenne on hierarkinen: tietotyypit liittyvät toisiinsa seuraavassa järjestyksessä.

Entry

Entry Header Fields

Text Fields

Attribute Fields
Index Fields
Text Fields
Attribute Fields
Attribute Fields


Lyhyesti sanoen: Entry on ylin taso, seuraava on Index, sitten Text, sitten Attribute. Ylempään tasoon voi liittyä kaikkien sitä alempien tasojen kenttiä. Toisaalta esimerkiksi tekstikenttään ei voi liittää toista tekstikenttää.

Haku MultiTermistä

MultiTermistä tieto voi hakea nopeasti ja helposti hakemistokentistä. Haluttu hakemistokenttä haetaan Index: kenttään ja hakuehto kirjoitetaan keskimmäiseen kenttään. Hakuehto voi olla tarkka tai siinä voi esiintyä jokerimerkkejä. Kun hakutulos on joukko, se näytetään Hit List -ikkunassa.

Monimutkaisempia hakuehtoja varten on määriteltävä filtteri eli suodin. Tämä on huomattavasti työläämpi toimenpide. Suodin määritellään Define Filter-dialogissa hakemalla esiin kenttä, johon ehto kohdistuu ja kirjoittamalla hakuehto tekstikenttään. Ehtoja voi olla sekä samanaikaisia (AND) että vaihtoehtoisia (OR). Tekstikenttään kirjoitettava hakuehto voi olla negatiivinen (esimerkiksi !* edellyttää, että kenttä puuttuu tai on tyhjä).

Vienti MultiTermistä

Termien vienti ulos MultiTermistä tekstitiedostoksi tai tulostukseen tapahtuu määrittelemällä sopiva filtteri sekä valitsemalla tai määrittelemällä vientimuoto. Vientimuoto määritellään Define Export -dialogissa.

Tulostus MultiTermistä on yhtä kuin vienti Word-muotoon. Termit viedään Word-tiedostoksi ja tulostetaan Wordista.

Tuonti MultiTermiin

Termit tuodaan MultiTermiin määrämuotoisesta tekstitiedostosta. Tekstitiedoston rakenteen tulee vastata sen termikannan rakennetta, johon termit viedään. Tuontitiedoston rakenne on yksinkertaisimmillaan seuraava:
 
** tietueraja
<Note>tämä on esimerkki tietueeseen liittyvä huomautus
<Subject>general tietueeseen liittyvä attribuuttikenttä
<English>example hakemistokenttä
<Source>N.N. hakemistokenttään liittyvä attribuuttikenttä
<Definition> this is a definition hakemistokenttään liittyvä tekstikenttä
<Source>N.N. tekstikenttään liittyvä attribuuttkienttä
<German>Beispiel seuraava hakemistokenttä
<Gender>n hakemistokenttään liittyvä attribuuttikenttä
**  

ValTer3

ValTer3 on relaatiotietokanta. Tietotyyppien välillä on enemmän yhdistelymahdollisuuksia kuin MultiTermissä. Tiedot on talletettu taulukoiksi eli tietotauluiksi, joita ValTer3:ssa on seuraavia:
 
Relaatio Kentät Selitys
     
term   termi
  id termin numero
  concept käsitteen numero
  lang termin kieli
  name termin nimitys
  cat termin luokitus
     
text    tekstikenttä
  id määritelmän numero
  content määritelmän kohde
  lang määritelmän kieli
  string määritelmän teksti
     
attn    piirre
  id piirteen numero
  type piirteen attribuutti
  source piirteen kohde
  target piirteen arvo
     
reln   relaatio
  id relaation numero
  type relaation nimi
  source relaation ensimmäinen jäsen
  target relaation toinen jäsen
     
desn    tekstikenttä
  id tekstikentän numero
  type tekstikentän tyyppi
  source tekstikentän kohde
  target tekstikentän teksti
     
source   lähdetieto
  object lähdetiedon kohde
  abbr tietolähteen lyhenne
  notes tarkempi lähdetieto (esim. sivu)
     
change   päivitystieto
  object päivityksen kohde
  author päivityksen tekijä
  date päivämäärä
  status tiedon status
  notes päivitystoimet
     
biblio   kirjallisuuslähde
  abbr lyhenne
  <fields> lähteen kirjallisuustiedot
     
person   henkilötieto
  abbr lyhenne
  <fields> henkilötiedot

Standardeista


ISO MATIF

ISO TC 37

Standard Generalised Markup Language (SGML)

Hypertext Markup Language (HTML)

<H2>Tason 2 otsikko</H2>