Yliopiston etusivulle In English
Helsingin yliopisto
clt130: Kieliteknologian ATK-ympäristö (Clt130) - lukuvuosi 2009-2010

Yhteystiedot

Yleisen kielitieteen laitos

PL 24 (Unioninkatu 40)
00014 HELSINGIN YLIOPISTO

Puhelin +358 (09) 1911 (vaihde)
Faksi +358 (09) 191 28313

1. luennon asiat

Jotain Windowsista ja Unixista

Unix-luokan windows-ympäristöön kirjaudutte omalla tunnuksellanne ja salasanallanne, joten siellä voitte mellestää rauhassa. Kukaan muu ei nää, eikä pääse muuttamaa sinne tehtyjä juttuja.

Unix-palven sijaitsee osoitteessa corpus.csc.fi.

Palvelin on kätevä, koska sen avulla pääset käsiksi omiin tiedostoihisi ja myös laitoksen ohjelmiin (josta osa olisi muuten maksullisia tai ei yksityisille henkilöille saatavissa) mistä vain, kunhan sinulla on nettiyhteys ja jokin SSH-ohjelma (esim.putty) käytössä. Varmuuskopioinnista ei myöskään tarvitse huolehtia. Palvelimen tiedostoista otetaan suhteellisen usein "kopio" ylläpidon toimesta ja tiedostot saadaan täten ongelma tilanteessa palautettua. Palvelin on myös käytettävissä 24h vuorokaudessa.

Palvelinta komennetaan rivipohjaisilla käskyillä, joka voi olla aluksi hieman omituista verrattuna graafisiin käyttöliittymiin, mutta käsittelemme käskyjä ja muuta toimintaa palvelimella/unix:ssa ensi viikolla lisää.

Unix:ssa on myös paljon sisäänrakennettuja toimintoja, joita pääsee hyödyntämään palvelimen kautta (ja joista on kieliteknologeille hyötyä, kuten tulette seuraavilla kursseilla sitten käytänössä paremmin kokemaan).

SSH-yhteyden luominen Windowsista

Tässä ohjeessa oletetaan, että tarvittava ohjelma (yliopiston suosittelema PUTTY) on jo asennettuna käyttäjän koneelle.

  1. Käynnistä ohjelma valitsemalla PUTTY valikosta.
  2. Kirjoita kohtaan "Host Name" corpus.csc.fi ja paina "Connect"-painiketta. Ensimmäistä kertaa yhteyttä otettaessa kone pyytää varmistuksen, halutaanko yhteys todella ottaa. Valitse "Yes".
  3. Näytölle ilmaantuu musta ruutu. Syötä käyttäjätunnuksesi komentoriville kohtaa "login as:" ja paina rivinvaihtoa.
  4. Syötä salasanasi komentoriville kohtaan "password:" ja paina rivinvaihtoa.
  5. Olet ytimessä, eli corpuksessa.

SSH-yhteyden lopettaminen

Kun haluat lopettaa yhteyden palvelimelle kirjoita komento riville "exit" (ilman hipsuja siis :). Jossain toimii myös "lo".

Windowsissa PUTTY-ruutu sulkeutuu kokonaan kun yhteys lopetetaan.

Demo

  • Kuvitteellinen leksikon kehittäjä haluaa tietää kumpi on yleisempi sana suomenkielessä 'vihta' vai 'vasta'
  • Etsitään tekstin pätkiä joissa esiityy sanat vihta ja vasta ja muodostetaan näistä tekstitiedosto
  • Tutkitaan tekstitiedostoa vaikka seuraavan käskyn avulla:
  • tr -s ' ' '\n' < vihta_vasta.txt | tr -dc 'a-zåäöA-ZÅÄÖ\n' | sort | uniq -c | sort -nr | head
  • tai vaihtoehtoisesti:
  • Googlefight
  • 'vasta' on homonyymi, eli samalla kirjoitusasulla on monta merkitystä (voidaan joissakin tap. disambiguoida esim. lause lokaation perusteella, mutta helpompi jos jätetään toinen harvinaisempi merkitys pois)

Salasanan vaihto

Kun vaihdatte salasanan voi kestää jonkin aikaa ennen kuin uusi salasana tulee voimaa. Perjaatteessa vanhan salasanan pitäisi toimia siihen asti kun uusi tulee voimaan, muta kannattaa ensin kirjautua sisään ja tehdä mitä nyt aikookin sillä kertaa koneella tehdä ja sitten vasta lopuksi vaihtaa salasana. Näin välttyy varmemmin ongelmatilanteilta.

  • Kirjaudu corpus-palvelimelle, yllä olevien 1. luennon ohjeiden mukaan.
  • Kirjoita komentorivilla käsky: passwd
  • Kirjoita vanha salasana.
  • Kirjoita uusi salasana.
  • Varmenna vielä uusi salasana.
  • Kirjaudu ulos ja lähde tunniksi kahville tai kotiin.