Statistik: surfare utifrån har bekantat sig med den här texten sedan 28.10. 1997.

Språkens öde - mötet med informationsteknologin och dess språk

Fred Karlsson

Helsingfors universitet

Föredrag hållet vid Nordiska rådets temakonferens "Nordisk kultur under internationell press" den 3-4 mars 1997, Stortinget, Oslo. Ett sammandrag av föredraget och den därpå följande diskussionen har publicerats i Charlotta Friborg, Mellan självförtroende och osäkerhet. En essä om nordisk kulturpolitik, Nordisk rådet, TemaNord 1997/555, s.35-36.1. Informationsteknologins språk

Med informationsteknologins språk kan man avse två olika saker. För det första är hela informationsteknologin baserad på olika nivåer av konstgjorda tekniska språk, som jag här kallar t-språk. Hit hör bland annat informationskoder såsom ASCII (American Standard Code for Information Interchange), programmeringsspråk såsom C++, Cobol och Prolog, samt till och med operativsystem såsom Windows och Unix. Med hjälp av alla dessa styr och använder mänskorna sina datorer och den information som lagrats i dem. T-språken är ofta invävda i varandra.

Den andra dimensionen av begreppet "informationsteknologins språk" är helt enkelt engelskan, som i praktiken kommit att bli informationsteknologins internationella vardagsspråk. Samma dominerande ställning har engelskan förstås fått också inom många andra domäner av vetenskap, teknologi och kultur.

Det är värt att notera, att t-språken och delar av engelskan är sammanvävda på ett intrikat sätt. T-språkens ord och sammansatta uttryck är ofta lånade från engelskan: type, list, go, print, {if x =3 jump to y} osv. Det här bidrar till att befästa engelskans ställning som IT-språket framom andra.2. Vardagsspråk

Å andra sidan har vi våra modersmål, de naturliga vardagsspråken, hos oss i Norden danska, finska, färöiska, grönländska, isländska, norska, de samiska språken, svenska, de dövas teckenspråk, hundratals invandrarspråk osv. Engelskan har en speciell ställning bland vardagsspråken, en förmån och ett försprång, eftersom den kommit att bli också ITs vardagsspråk.

När informationsteknologin används mer och mer i det dagliga livet av allt fler vanliga mänskor, påverkas två olika dimensioner av vardagsspråken så småningom. Dels förändras språkens struktur, dvs framför allt ordförråd och i någon mån också grammatik. För det andra förändras somliga mer eller mindre konventionella regler för hur språket används i olika situationer. Hit hör bland annat nya typer av kommunikationsvanor såsom e-post.3. Hur påverkar t-språken vardagsspråkens struktur?

Ursprungligen var den så kallade 7-bitars ASCII-koden det viktigaste sättet att representera information i en dators minne. Med den här koden kunde bara 128 olika tecken uttryckas i binär form, dvs som kombinationer av nollor och ettor. Bland dessa 128 tecken fanns nog alla engelskans bokstäver, men inte "speciella" bokstäver i ett stort antal andra språk, t. ex. olika nordiska språks Å, å, Ä, ä, Ö, ö, Æ, æ, Ø, ø, , , Þ, þ, Ð, ð. Trots att nya och mera fullständiga informationskoder har utvecklats, är problemen med de "skandinaviska bokstäverna" fortfarande mycket vanliga, speciellt vid informationsöverföring via modem och internet. Det har redan uppstått ett tryck på att förenkla de nordiska ortografierna. Ett exempel är när bolaget Skånska ändrar sitt namn till Skanska.

En annan form av strukturell påverkan kan ses vid kommunikation mellan mänska och dator då reducerade former av vardagsspråk används för att kommunicera med datorn eller något tillämpningsprogram i den. Uppgiften att få datorer att förstå normalt skrivet vardagsspråk, t.ex. norska eller finska, är långt ifrån löst ännu. Ännu svårare är naturligtvis problemet med att få en maskin att begripa talspråk. Reducerade system som bygger på de enklaste delarna av vardagsspråket förekommer redan. Sådana system tillåter bara (eller känner bara igen) vissa ord, typiskt några tio- eller hundratal, samt vissa enkla meningsstrukturer, typiskt korta påståendesatser och frågesatser. Man talar t.ex. om Reduced English eller Controlled English. En risk för utarmning av språkstrukturen finns alltså i kommunikationen mellan mänska och maskin.

Denna risk bör motverkas genom systematisk forskning i datalingvistik och språkteknologi, både beträffande talat och skrivet språk. Detta är speciellt viktigt i ett område som Norden, där många av språken strukturellt skiljer sig på betydande sätt från engelskan.

Den synligaste och för var och en uppenbara formen av strukturell påverkan på de nordiska språken är floden av informationsteknologiska lånord från engelskan: bit, disk osv. Fenomenet är naturligtvis bekant från många andra levnadsområden också. Det är inte alltid självklart hur dessa ord skall böjas i olika nordiska vardagsspråk, t.ex. många bit eller många bitar. Oron i ordens böjningssystem växer i takt med att antalet oassimilerade lånord ökar. För det andra är de nya lånordens betydelser ofta oklara och diffusa för många språkanvändare.

Sådana processer har i alla tider varit en del av den naturliga språkutvecklingen. För språksamfundets del är den klasssiska frågan huru mycket standardisering och medveten språkplanering som behövs. Man behöver inte vara värdekonservativ för att inse vikten av medveten språkplanering och systematiskt arbete på att stabilisera olika terminologier. Detta blir allt viktigare ju starkare engelskans inflytande tenderar att bli. (I Frankrike har nationalförsamlingen ju rentav stiftat en lag som bland annat "förbjuder försäljningen av tjänster och varor på ett enda språk om detta inte är franska".)

Ett viktigt delproblem är den så kallade lokaliseringen av dataprogram, t.ex. ordbehandlingsprogram. Med detta menas anpassningen till lokala förhållanden, framför allt de lokala språken. Det är ingalunda likgiltigt om det finns eller saknas högklassiga hjälpmoduler till ordbehandlingsprogram på de lokala språken, t.ex. automatisk avstavning av ord vid radslut och väl fungerande program för stavningskontroll.4. Nya former av språkanvändning

Internet och e-post har introducerat delvis nya typer av distanserad kommunikation, dvs kommunikation på avstånd. Framför allt har det blivit mycket lättare att sända meddelanden från en till många. Aktivt kan man göra detta till en stor eller liten skara mottagare med e-post som på många sätt är effektivare och snabbare än traditionella skrivna brev. På samma sätt kan man delta i olika typer av elektroniska diskussionslistor. Aktiv språkanvändning är det också fråga om då man lägger ut dokument på internet, t.ex. en egen hemsida. Som passiv språkanvändare, mottagare, kan man ge sig up på internet och se vad man hittar.

Som kommunikationsform ligger e-posten mellan det talade och det skrivna språket. Det är inte typiskt talat språk, eftersom mottagaren inte syns, och eftersom man skriver med datorn. Å andra sidan är det inte heller typiskt skrivet språk, eftersom ett e-postbudskap vanligen komponeras snabbt, utan grundligare planering, i kort form som svar eller kommentar till ett budskap man just fått eller snappat upp. E-posten är med andra ord mera omedelbar, interaktiv och informell än traditionellt skrivet språk. E-posten har karakteriserats som "att tala genom att skriva", "att skriva genom telefonen" och "paneldiskussion i slow motion".

E-postmeddelanden kan ibland vara överraskande emotionella, speciellt då oerfarna avsändare glömmer bort att deras budskap kanske går ut till en stor mängd mottagare, större än avsändaren själv egentligen avsett. Detta händer speciellt då man använder den behändiga funktionen "reply-to" för att besvara ett inkommet meddelande, och inte noggrant kontrollerar till vilka ens svar går ut via "Cc:" som kanske var påkopplat i det inkomna meddelandet. Oerfarna användare av e-post tror sig ofta vara anonymare än de faktiskt är. I extrema fall, inte helt ovanliga, urartar elektroniska diskussioner till invektiv. För detta har redan uppstått en skild term: "flaming". Interaktionen mellan sändare och mottagare är alltså definitivt av en ny typ i den elektroniska kommunikationen.

Rent språkligt finns det inga belägg för att e-post och elektroniska diskussionslistor i sig skulle leda till språklig utarmning. Närmast är det fråga om en ny språkvariant mellan talat och skrivet språk, där man måste lära sig "netiketten", reglerna för hur samvaron fungerar.5. Internet som helhet ur språklig synvinkel

Internet som helhet är mera problematiskt ur språklig synvinkel.

För det första är det klart, att publikationströskeln sjunker (har sjunkit) på internet. Vem som helst kan lägga ut vad som helst på nätet, också dåliga skribenter som skriver klumpigt och kanske till och med ogrammatikaliskt. Klena skribenters alster får på internet en större synlighet än de skulle få i den traditionella skrivna kulturens sfär. Nu vimlar internet av allehanda skrivfel.

En slutledning måste därför bli att modersmålsundervisning och (rimlig) språkvård blir allt viktigare. Det är självfallet också viktigt att ge barn och ungdom insikter och färdigheter i det som nu kallas "information literacy", dvs förmåga att använda datorer, tillämpningprogram och utbudet på internet. Den självklara grundförutsättningen borde dock vara en säker förmåga att använda modersmålet (och senare andra språk!) på ett idiomatiskt sätt, annars kan i det långa loppet den kollektiva språkkänslan försvagas.

Andra kritiska synpunkter på internet är att textsnuttarna tenderar att bli korta. Bilder, animationer, grafik osv tränger delvis ut den skrivna texten. De utmärkta möjligheterna att manipulera typsnitt, font och annat får många att fästa mera vikt vid buskapets grafiska utseende än vid dess språkdräkt, för att inte tala om innehållet självt som ju borde vara viktigast av allt!

E-post och internet som elektroniska medier tenderar att leda till en egendomlig form av historielöshet eftersom datafiler har en mycket lägre historiskt beständighet än traditionella brev och andra dokument som skrivits på papper. Naturligtvis är det fortfarande viktigt att lämna synliga dokumentspår efter sig, speciellt för efterkommande generationer.

Internet omfattar redan tiotals miljoner dokument, speciellt på engelska, men på många andra språk också. Ett mycket angeläget intresse är utvecklandet av metoder för att strukturera detta enorma material vad beträffar innehållet. Var och en som söker någonting på internet vill naturligtvis helst hitta de mest relevanta dokumenten man är ute efter. Det är alltså fråga om avancerad innehållsklassificering och innehållsvärdering, med utgångspunkten i den specifika fråga som någon internetanvändare ställt. Det primära redskapet för att uttrycka innehåll på internet och i allmänhet är naturligtvis vardagsspråken, för oss i Norden speciellt de nordiska språken.

Innehållsklassificering och andra mer eller mindre automatiserade nyttofunktioner på internet kräver satsning på forskning, där informations-, kommunikations- och språkvetenskaper möts. Det är speciellt viktigt att inse att de nordiska språkens viktiga roll här. Man kan inte strukturera innehållet i dansk, finsk etc. text utan att behövligt teori och teknologi utvecklats för beskrivningen och analysen av språken i fråga.

Den här uppgiften är lika viktig som det var för ett antal sekler sedan att konstruera skriftspråk för de talade nordiska språken. Pennan och det första skriftspråket uppfanns för 5 000 år sedan (i Norden för 1 000 sedan), boktryckarkonsten tillkom för 500 år sedan. Dessa uppfinningar gjorde det möjligt att teckna ned talspråk till texter, som enkelt kunde multipliceras (tryckas) och sedan med transportväsendets (postens osv) hjälp delas ut åt stora mängder läsare. Detta var ett avgörande steg mot det klassiska industrisamhället, där skriven och sedermera också talad masskommunikation blivit ett av de viktigaste sammanhållande och innovationsspridande elementen.

Det råder ingen tvekan om att datorteknologin utgör ett kvantumsprång i informationsteknologins historia. Den 5 000 år gamla pennan är säkert den mest revolutionerande uppfinningen i teknologins långa historia, men i dag har den fått en allvarlig konkurrent i datorn, varmed jag här avser konglomeratet av relevant hårdvara som integrerade kretsar osv, samt mjukvara som koder och program på olika abstraktionsnivåer. Om pennan håller på att ersättas av datorn, kan vi vad informationsdistributionen gäller säga att boktryckarkonsten och transportväsendet tillsammans håller på att ersättas av internet. Internet är dagens innovation för att ge snabb social diffusion av information och rentav kunskap åt stora grupper mottagare. Ur teknologins, kommunikationens och socialhistoriens synvinkel är det fråga om en mycket betydelsefull ny utvecklingsfas.

Om vi vill att våra nordiska språk i framtiden skall kunna hävda sig framförallt mot engelskan som fullfjädrade medel för kommunikation på internet och andra typer av elektroniskt informationsutbyte mellan vanliga mänskor, krävs inte bara insikt om modersmålens betydelse för individer och samhällen utan också nya typer av tvärvetenskaplig forskning och forskningssatsningar.Författarens address:

Institutionen för allmän språkvetenskap

Postbox 4

FIN-00014 Helsingfors universitet

e-mail: fkarlsso@ling.helsinki.fi

fax +358 9 653726

tel + 358 9 19123512