Skip to content

Er dansk sprogteknologi i verdensklasse? Eller står dansk overfor ’digital udryddelse’?

ER DANSK SPROGTEKNOLOGI I VERDENSKLASSE?

Eller står dansk overfor ’digital udryddelse’?

”Som min gamle mor siger: ’Det kan godt være, at det er robotter, der skal tage sig af os gamle, men hvis de ikke kan forstå, hvad jeg siger, så kan det jo ikke nytte noget’.”

Tekst / Niels Christiansen
Foto / Camilla Utke Schiøler
Udgivet / Juni 2019

I begyndelsen af 2018 nedsatte Kulturminister Mette Boch et sprogteknologisk udvalg for at afdække behovet for at understøtte brugen af dansk i forbindelse med kunstig intelligens (AI). Det resulterede i en rapport, der udkom i april 2019.

Udvalgets konklusion var stjerneklar: Udvikling af chatrobotter, taleassistenter, tekstanalysesystemer, automatisk oversættelse med mere med høj sproglig kvalitet for dansk er en enorm udfordring for de globale og lokale AI-virksomheder.

De investeringer, som skal til, er for høje, og det modvirker udviklingen af nye AI-produkter i et sundt og konkurrencedygtigt marked. Og det kan betyde digital udryddelse af det danske sprog.

Udvalgets rapport hedder ’Dansk sprogteknologi i verdensklasse’. En forunderlig titel al den stund, at rapporten når frem til det modsatte resultat.

Dansk sprogteknologisk status

Vi har alle prøvet det. Mobilen op af lommen. Vi tænder for Google Translate i et hurtigt desperat forsøg på at oversætte en sætning, vi ikke kan forstå i den artikel, vi sidder og læser på et udenlandsk sprog. Men med oversættelsen sidder vi endnu mere forvirret tilbage. Det er volapyk.

Det skyldes, at teknologien i vores mobiltelefon – eller i appen – ikke er god til dansk.

Dansk sprogteknologi har det ikke fantastisk. Det er status.

”Dansk sprog står ikke supergodt rent teknologisk,” siger Bolette Sandford Pedersen, der er professor i sprogteknologi ved Københavns Universitet.

Hun peger på, at dansk ikke er noget stort sprogområde, men at dansk sprogteknologi alligevel godt kunne stå bedre, hvis det blev prioriteret højere nationalt set:

”Vi ligger for dårligt i forhold til de ressourcer, vi har i Danmark. Og vi ligger også relativt dårligt, hvis vi ser på, hvor digitalt langt vi er fremme i skoene på mange andre områder. For Danmark er et af de mest digitale lande i verden, og det skulle automatisk føre med sig, at vi også sprogteknologisk var i verdensklasse.”

Men det er vi ikke.

● Bolette Sandford Pedersen,

professor i sprogteknologi ved Københavns Universitet: ”Det private marked i Danmark har ikke alene kunnet løfte dansk sprogteknologi. Men det er i høj grad lykkedes på engelsk.”

Hvorfor er dansk sprogteknologi vigtig?

I rapporten fra udvalget forklares det, at det er et helt grundlæggende vilkår for al sproglig udvikling, at sproget bliver brugt i alle samfundets områder. Hvis sproget ikke bruges, mister det sin evne til at udtrykke det, som vi har behov for, på en smidig og hensigtsmæssig måde.

Det vil sige, at lærer Google Translate, Siri og andre apps ikke at forstå dansk bedre, end de gør nu, risikerer vi, at vi om få år slet ikke kan bruge dansk på vores telefoner eller i andre digitale sammenhænge.

”Efterhånden som vi bliver mere og mere digitale, og efterhånden som kunstig intelligens får større og større indflydelse alle steder i vores liv, så bliver det sprogteknologiske element meget vigtigt at få med,” forklarer Bolette Sandford Pedersen. ”Som min mor siger: ’Det kan godt være, at det er robotter, der skal tage sig af os gamle, men hvis de ikke kan forstå, hvad jeg siger, så kan det jo ikke nytte noget.’

”Det private marked i Danmark
har ikke alene kunnet løfte dansk
sprogteknologi. Men det er i høj
grad lykkedes
på engelsk.”

Det er ikke svært at forestille sig, hvor galt det kan gå. I dag er Google Translate eller Google Oversæt, som det hedder på dansk, blevet det naturlige valg, når mennesker skal kommunikere med hinanden på tværs af landegrænser. Det kan angiveligt oversætte mellem 103 sprog og bliver dagligt brugt af over 500 millioner mennesker (maj 2017, red.). Men alle, der har benyttet det, ved, at oversættelserne ofte går galt.

”Jeg har prøvet Google Translate af i forhold til nogle tekster indenfor sundhedsområdet,” siger Bodil Nistrup Madsen, der er professor ved CBS og i mange år har forsket indenfor vidensstrukturering og vidensdeling. ”Google Translate er virkelig ikke det bedste værktøj. Det er klart, at der er mange taleassistenter og robotter, som ikke går ned i dybden, men som bevæger sig på et generelt dagligdags sprogligt niveau. Men i det øjeblik, at vi kommer ned og skal have fat i de specifikke fagbegreber, så er sprogteknologi til dansk virkelig et problem.”

”Jeg forsøgte at lade Google Translate oversætte ’pausering’, som betyder ’midlertidig afbrydelse af lægemiddelordination efter anvisning af en dertil autoriseret person’. Google Translate oversatte det til: ’Break ring’. Det er helt gak,” siger Bodil Nistrup Madsen.

Danske udfordringer

Alle forskere er enige om, at sprogteknologien er forholdsvis godt udviklet på engelsk. Men da det er kostbart at udvikle sprogteknologi til små sprogsamfund – som dansk – er der risiko for, at de små sprog hen ad vejen bliver stående på perronen og ikke kommer med på det teknologiske tog, der i disse år drøner derudaf.

”Det private marked i Danmark har ikke alene kunnet løfte dansk sprogteknologi. Men det er i høj grad lykkedes på engelsk,” siger Bolette Sandford Pedersen og fortsætter:

”Et firma, der arbejder med det engelske sprogområde, kan lettere tjene penge med systemer på engelsk. Der er et helt andet indtjeningspotentiale. Og rent videnskabeligt så bliver der lavet meget forskning på engelsk, også blandt danske forskere, fordi det er på engelsk, man kan lave front-forskning. Det er svært at lave frontforskning på dansk, fordi den sproglige infrastruktur til at gøre det med, ikke er på omgangshøjde. Jeg tænker på danske sprogressourcer egnet til teknologisk brug.”

Så derfor foregår langt den største del af forskningen sprogteknologi på engelsk, og det samme gør den kommercielle udvikling. Og de to ting til sammen gør, at gabet konstant er voksende mellem, hvad man kan på engelsk, og hvad man kan på dansk.

Det gør heller ikke sagen lettere for dansk sprogteknologi, at dansk som sprog ikke er det letteste at arbejde med.

”Man siger, at der er nogle sprog, der er lettere at håndtere sprogteknologisk end andre. Det kan for eksempel handle om udtale. På spansk er forholdet mellem skrevet og talt sprog mere en-til-en, og dermed er det nemmere at lave taleteknologi for end for et sprog som dansk,” påpeger Bolette Sandford Pedersen.

Hvad kan vi gøre?

Men hvad gør vi så? Sprogteknologiudvalget foreslår, at der oprettes en dansk sprogbank, der skal tilvejebringe og vedligeholde danske sprogressourcer, som skal stilles til rådighed i høj lingvistisk kvalitet optimeret til sprogteknologiske formål.

”Der vil opstå ”sorte huller”
i det danske sprog.”

Professor, Bolette Sandford Pedersen

Sprogbanken skal blandt andet fungere som en sprogteknologisk værktøjskasse, der kan forbedre talegrænsefladerne til digitale assistenter og robotter, da kvaliteten af dansk talegenkendelse og talesyntese ikke fungerer optimalt i dag. Og sprogbanken skal også levere bedre værktøjer og ressourcer samt træning af automatiske oversættelsesværktøjer.

Sprogbanken skal også indeholde en termbank med specialiserede fagudtryk og -begreber, som skal indsamles og beskrives for at sikre kvalitet i forbindelse med offentlige it-projekter som for eksempel Sundhedsplatformen.

”En termbank vil bidrage til at, vi får en fælles forståelse af de centrale begreber indenfor særlige områder,” siger Bodil Nistrup Madsen. ”Vi vil kunne slå flere fluer med et smæk, hvis vi har terminologien på plads. En termbank er i sig selv et sprogteknologisk værktøj.”

Digital udryddelse

Fremtiden kan godt se truende ud, hvis man er professor og beskæftiger sig med det danske sprog. Angsten for, at der er mange sammenhænge, hvor dansk ikke fungerer, fordi dansk sprogteknologi ikke holder trit, er ikke grebet ud af luften.

”Så længe vi bruger dansk i alle dele af vores liv, så er jeg ikke bekymret for det danske sprog. Naturligvis vil dansk som sprog ændre sig, men det vil leve og udvikle sig. Men hvis vi holder op med at bruge dansk, fordi det er upraktisk i teknologiske sammenhænge, så bliver jeg bekymret. Det er den sikre vej til digital udryddelse, som der er blevet talt om, at vi risikerer,” siger Bolette Sandford Pedersen.

Digital udryddelse er et voldsomt udsagn, men det er noget, som EU i mange år har fremført, at flere af de europæiske sprog er truet af. Hvis de sprogteknologiske systemer ikke fungerer godt nok for de mindre sprog, så kan det få den konsekvens, at vi holder op med at bruge disse sprog i teknologiske sammenhænge – især i forhold til kunstig intelligens.

”Så skal vi tale engelsk til robotten, for at den forstår os. Det vil udgøre en sproglig forarmelse. Dels vil det gøre, at vores sprog ikke vil udvikle sig, og det vil ikke være anvendeligt i alle sammenhænge. Der vil opstå ’sorte huller’ i det danske sprog. På en måde er rapportens titel, ”Dansk sprogteknologi i verdensklasse,” en lille smule ironisk, fordi dansk sprogteknologi netop ikke er i verdensklasse – men det er selvfølgelig vores mål, at den bliver det – men det kræver en national satsning,” slutter Bolette Sandford Pedersen. ●

Tekst / Niels Christiansen
Foto / Camilla Utke Schiøler
Udgivet / Juni 2019

Kommagasinet er udgivet af Kommunikation og Sprog - fagforeningen for dig, der elsker kommunikation, sprog og marketing.

Back To Top
Search