skip to Main Content

Neural
oversættelsesteknologi
prøver at kopiere
din hjerne

Maskinoversættelse er stadig temmelig ubegavet. Men den rykker. Måske er der kun fem år til, at teknologiske oversættelsesværktøjer laver samme antal fejl som oversættere af kød og blod, anslår datalingvist.

Tekst / Dorthe Lundh
Foto / Carsten Bundgaard
Udgivet / Juni 2019

I dag forstår oversættelsesprogrammer ingenting. De gætter, ligesom når vi er på ferie i et land, hvor vi har lært os ganske få fraser på det lokale sprog og sjusser os frem til, hvornår vi kan bruge dem.

Sådan beskriver datalingvist ved CBS Daniel Hardt oversættelsesteknologien generelt anno 2019.

Men han fremhæver, at den neurale maskinoversættelse (NMT), som hen over de seneste år efterhånden har afløst den statistiske teknologi i de gængse værktøjer, rummer et stort potentiale for at kunne levere et oversættelsesprodukt af god kvalitet.

”Hvis man om fem år laver en objektiv optælling, er det sandsynligt, at maskinoversættelsesprogrammer, der er blevet trænet indenfor et fagligt felt, laver nogenlunde det samme antal fejl som professionelle oversættere,” vurderer Daniel Hardt.

Han påpeger, at vurderingen tager udgangspunkt i oversættelse af en standardtekst uden kreative passager og alene omhandler kvantitet.

”At maskinen laver samme antal fejl som oversætteren er slet ikke det samme som, at den kan oversætte i en tilsvarende kvalitet som oversætteren. Når en oversætter fejler, er der typisk tale om slåfejl eller andre småting, men oversættelsesprogrammets fejl kan være store og direkte misvisende, fordi programmet ikke forstår teksten. Derfor kan vi stadig ikke stole på maskinoversættelser om fem år,” understreger Hardt.

Daniel Hardt,

datalingvist ved CBS
”At maskinen laver samme antal fejl som oversætteren er slet ikke det samme som, at den kan oversætte i en tilsvarende kvalitet som oversætteren.”

Hjernens algoritme

Men måske på længere sigt. For det særlige ved den neurale teknologi er, at den er designet til at fungere som neuronerne i vores hjerner.

”Mennesker oversætter ud fra en algoritme i hjernen, som tager højde for de lingvistiske principper for de to sprog, teksten skal oversættes fra og til. Neural oversættelsesteknologi baserer sig derfor på, at vi kan udvikle algoritmer, der på en måde ligner den menneskelige hjerne,” forklarer datalingvisten.

At få en maskine til at forstå, hvor subjektet skal stå, lagre og lære kontekstafhængigheder er dog en udvikling, der kun lige er begyndt. Derfor er algoritmerne stadig temmelig dumme.

”Vi er slet ikke der, hvor de neurale netværk forstår, hvad der bliver sagt eller skrevet. De lærer bare udenad. Hvis de virkelig skal levere gode oversættelser, kræver det træning af programmerne ved hjælp af kvalitetsdata, men også sprog- og hjerneforskning, så vi kan blive klogere på, hvordan signalerne bevæger sig rundt i hjernen og udvikle algoritmer, der efterligner den kommunikation,” lyder det fra Daniel Hardt.

Selvom han forventer teknologiske forbedringer i løbet af de kommende fem år, er der ifølge Daniel Hardt ikke udsigt til at oversættere kan erstattes af neurale værktøjer.

”Det har meget lange udsigter, før maskinoversættelse kan håndtere kreative tekster, men jeg vurderer, at NMT om indenfor en overskuelig årrække bliver en reel hjælp til de professionelle, så de oplever effektiviteten ved maskinoversættelsen uden at skulle afgive kontrollen over oversættelsen. I den optimale verden betyder det mere tid til det kreative element.”

Oversætterne og deres digitale værktøjer

HVEM:
René Sehested Thomsen, ph.d. og cand.ling.merc. i tysk.

TITEL:
Oversætter hos Semantix.

Hvad er dit arbejdsområde?
Jeg oversætter mellem dansk og engelsk og dansk og tysk for en række større danske virksomheder. Primært marketingmateriale.
Derudover redigerer jeg danske tekster og læser korrektur på kollegers og kunders oversættelser.

Hvilke oversættelsesværktøjer bruger du i dit arbejde?
Hos Semantix bruger vi Memsource, som er meget brugervenligt og langt hurtigere end SDL Trados Studio, som jeg tidligere har brugt. Blandt andet er det en stor fordel, at det er cloudbaseret, så man kan tilgå det hvor som helst.

Hvordan bruger du værktøjet?
Når jeg får tildelt en opgave, har en af vores projektledere forberedt den ved at lægge den ind i Memsource-platformen og tilknytte en eller flere kundespecifikke TM’er (Translation Memory, red) og eventuelt en termbase til den.

Der er altid knyttet en TM til en opgave og ofte også en termbase, hvis kunden har tilkøbt den funktion. Det giver mig rigtig gode muligheder for at kontrollere, om jeg for eksempel oversætter en term, en vending eller et slogan på samme måde som i mine tidligere oversættelser for kunden. Og hvis der skal andre oversættere på opgaven, har de så også mulighed for at tilgå alle de tekster, vi har oversat tidligere, da de ligger gemt i oversættelseshukommelsen – det er en stor fordel for alle parter.

Hos Semantix bruger vi også MT (Machine Translation, red.). Vi har nogle såkaldte MT engines, som vi har tilpasset eller trænet til den enkelte kunde. Og de kan så gå ind og lave en automatisk oversættelse. Resultatet kan være rigtig godt ved meget standardiserede tekster, men jo mindre standardiseret og mere kreativ en tekst bliver, jo mere efterredigering kræver det. Og så kan man sommetider lige så godt slette forslaget helt og starte fra bunden.

Hvad er din holdning til oversættelsesværktøjer?
De værktøjer, jeg har arbejdet med, er blevet markant bedre de seneste år, og jeg har svært ved at forestille mig at skulle arbejde uden dem.

Har oversættelsesteknologi en positiv effekt på produktet?
Ja, det er min overordnede vurdering. Især er oversættelsesværktøjerne gode til at sikre, at kunden får et produkt, der er konsistent, fordi de endelige oversættelser bliver gemt i oversættelseshukommelsen.

Hvad er ulempen ved at bruge et oversættelsesprogram?
Som oversætter kan man godt blive lidt for ukritisk over for de oversættelser, maskinen foreslår. De ligger ofte meget tæt op ad udgangsteksten, og det er ikke altid optimalt.

Hvordan tror du, at dit job ser ud om fem år?
Jeg gætter på, at jeg kommer senere ind i processen, i takt med at oversættelsesværktøjerne bliver bedre. Så om fem år laver jeg nok primært reviews og post-editing, som det også hedder. Den udvikling er allerede godt i gang. I hvert fald er det sjældnere og sjældnere, at jeg begynder helt fra bunden på en opgave.

HVEM:
Lenore Messick, BA i engelsk litteratur fra Bryn Mawr College, uafsluttet ph.d.-studie i litteratur- og kønsteori fra the Johns Hopkins University i USA

TITEL:
Sprogkonsulent på Aarhus Universitet i afdelingen Events og Kommunikationsstøtte

Hvad er dit arbejdsområde?
Cirka halvdelen af min arbejdstid oversætter jeg tekster fra dansk til engelsk primært for rektoratet og administrationen på AU.

Den anden halvdel bruger jeg på at være faglig ansvarlig for universitetets oversættelsesværktøj Memsource. Jeg laver kurser for ansatte, forhandler med vores leverandør, opsætter kvalitetskriterier, finder den rette data og gør dem klar til træning af vores maskinoversættelsesløsning. Jeg er også ansvarlig for vores værktøjer AU Dictionary og AU Translate, som bruges både af sprogmedarbejdere i Memsource og af vores studerende og medarbejdere, når de skal lave uformelle oversættelser til engelsk.

Hvilke oversættelsesværktøjer bruger du i dit arbejde?
Til mine oversættelsesopgaver bruger jeg termbaser og oversættelseshukommelser i Memsource. Nogle gange bruger jeg også maskinoversættelsesfunktionen.

Hvordan bruger du værktøjet?
Det kommer lidt an på, hvilken type tekst jeg skal oversætte, og hvem målgruppe og afsender er. Termbaserne og oversættelseshukommelserne betragter jeg nærmest som en del af min hjerne, når jeg arbejder, men jeg kan godt finde på at slå MT (maskinoversættelsesfunktionen, red.) fra. Det bliver for mange input, når man har den kørende også, og jeg risikerer, at den frarøver mig følingen med teksten. For mig er MT lidt ligesom at have en papegøje siddende på skrivebordet – nogle gange siger den noget relevant, andre gange skræpper den bare.

Hvad er din holdning til oversættelsesværktøjer?
Maskinoversættelse er jo kommet for at blive, og jeg synes, det er super spændende at følge med udviklingen. Siden 2011, hvor vi på AU tog Memsource i brug, er kvaliteten blevet bedre for hver træning, hvilket sker cirka en gang om året. Men der er stadig en lang række situationer, hvor MT ikke er den store hjælp. Jeg oversætter mange taler, og når teksten er retorisk, journalistisk, eller hvis kildeteksten ikke er særlig godt skrevet, så er kvaliteten af maskinoversættelsen ofte noget juks, fordi maskinen oversætter ord for ord, ikke meninger.

Her i foråret er AU gået over til neural oversættelsesteknologi i Memsource. Den fungerer anderledes og er ikke opbygget som SMT (statistisk maskinoversættelse, red.). Typen af fejl har ændret sig med den nye teknologi, men jeg har ikke helt dannet mig en mening om, hvad jeg synes.

Hvad har oversættelsesteknologien betydet for dit job?
Maskinoversættelse har skabt en forventning om, at vi kan oversætte hurtigere, men det er ikke altid en genvej, når jeg skal læse maskinens bud, vurdere det i forhold til kildeteksten og derefter redigere.

Der er dog ingen tvivl om, at de cloudbaserede løsninger har gjort mange ting nemmere. Blandt andet at dele viden og værktøjer internt i organisationen og med vores eksterne samarbejdspartnere.

Hvordan tror du, at dit job ser ud om fem år?
Om fem år er jeg blevet bedre til at gå ned i Memsources maskinrum, så jeg er bedre til at stille krav til vores leverandør og være en god medspiller.

Jeg tror også, at mit job gradvist får en endnu større faglig spændvidde på grund af den teknologiske udvikling. Indenfor de seneste år er oversættelser af tekster til video for eksempel blevet en ny gren af mit arbejde. Jeg er ikke bange for at oversættelsesopgaverne forsvinder.

Tekst / Dorthe Lundh
Foto / Camilla Utke Schiøler
Udgivet / Juni 2019

Kommagasinet.dk er udgivet af Kommunikation og Sprog - fagforeningen for dig, der elsker kommunikation, sprog og marketing.

Back To Top
×Close search
Search