
Hvad har automatisk oversættelse og selvkørende biler tilfælles?
Hvad har automatisk oversættelse og selvkørende biler tilfælles?
At vi i en ikke så fjern fremtid kommer til at møde selvkørende biler på vejene, betragter de fleste nok som sandsynligt. Om oversættelsesmaskiner ender med at overhale selv professionelle oversættere, er der nok mindre enighed om. Der er dog ingen tvivl om, at maskinerne er trukket ud i overhalingsbanen.
Både når vi taler om biler og oversættelsessystemer, som vi her billedsprogligt kalder oversættelsesmaskiner, har automatiseringen fart på. I bilindustrien er målet at udvikle biler, som kan transportere os fra A til B, mens vi tager en lur. I datalingvistikken er målet at udvikle oversættelsesmaskiner, som kan transportere indholdet fra en kildetekst på ét sprog til en måltekst på et andet sprog, mens vi tager en slurk kaffe. Det er kunstig intelligens, der skal muliggøre begge dele. Der er dog mindst to iøjnefaldende forskelle. For mens vi for længst er hoppet ombord i oversættelsesmaskinen, kører de selvkørende biler kun meget få steder. Desuden gælder der tilsyneladende en nultolerance for fejl, når vi taler om biler, mens vi som samfund godt kan leve med uperfekte oversættelser.
Oversættelsesmaskiner anvendes i dag af de fleste professionelle oversættere. Men reelt bruger vi dem næsten alle sammen. Gratis oversættelsestjenester som Google Translate er således en del af mange menneskers medieøkologi. Ofte aktiverer vi dem selv, men vi møder også mange tekster på nettet, som er blevet maskinoversat, uden at vi har bedt om det.
Når maskinoversættelse er så udbredt, kan det undre, at kun de færreste ved, hvad oversættelsesautomatisering egentlig er for noget. Det kan blandt andet skyldes, at vi ikke har love, der forbyder dårligt sprog, selvom oversættelsesmaskiner påvirker vores sprog negativt. De gør vores tekster sprogligt mindre varierede, reproducerer udgangssproglige sætningsstrukturer, opfinder ord og oversætter indimellem slet og ret forkert. Selvkørende biler derimod må man kun bruge som led i forsøg her i Danmark. For de kan jo potentielt slå mennesker ihjel. Den begrænsede viden kan også skyldes, at det simpelthen er meget svært at forstå, hvad en oversættelsesmaskine gør ved teksterne. Måske kan det forklare, at mange bruger gratis oversættelsestjenester uden at kende deres mangler eller de etiske problemstillinger.
Hvor gode er de selvkørende oversættelsesmaskiner?
De oversættelsesmaskiner, vi anvender i dag, er typisk neurale oversættelsessystemer, der efterligner den menneskelige hjerne. Systemerne trænes med online data og regner sig ved hjælp af algoritmer frem til, hvordan ord i en sætning kan oversættes ved at inddrage de ord i teksten, der går forud og følger efter. Denne tilgang har betydet, at maskinoversatte måltekster i mindre grad end tidligere er præget af forkert ordstilling, grammatiske fejl og lignende. Den har altså gjort teksterne mere læsbare. I mange situa-tioner er den form for oversættelse fyldestgørende. For eksempel når vi booker sommerferien på en udenlandsk hjemmeside. Men skal en virksomheds hjemmeside eller marketingtekst lokaliseres og gøres eksternt tilgængelig på flere sprog, er der stadig ofte brug for professionelle oversættere. For maskinerne besidder ikke social intelligens, som gør dem i stand til at tilpasse målteksterne til kommunika-tionssituationen. Det skal derfor tages med et gran salt, når teknologiudviklere proklamerer, at deres systemer kan oversætte lige så godt som mennesker.
Automatiseringen har foden på speederen
Som samfund bør vi se i øjnene, at maskinerne bliver stadig bedre til at imitere den menneskelige hjerne. De kommer derfor formentlig til at kunne hjælpe os stadig mere, hvis vi vælger at gøre brug af dem. Hvis de en dag kommer til helt at kunne undvære os, ville man kalde det for fuld automatisering.
Der gælder tilsyneladende en nultolerance for fejl, når vi taler om biler, mens vi som samfund godt kan leve med uperfekte oversættelser
De værktøjer, som mange professionelle oversættere anvender i dag, kan automatisere dele af oversættelsesprocessen. Mange bruger såkaldte CAT-værktøjer (computer-aided translation), som typisk indeholder en termbase og en translation memory, det vil sige en oversættelseshukommelse. De kan lagre og automatisk genfinde henholdsvis relevante termer og oversættelser af hele sætninger, som tidligere er blevet oversat af et menneske. Nogle CAT-værktøjer kan også tilbyde oversætteren oversættelsesforslag produceret af en maskine.
Oversætteren kan for eksempel bede maskinen om at maskinoversætte en sætning, hvis oversættelseshukommelsen ikke indeholder et egnet forslag, eller lade den oversætte en hel tekst og efterfølgende selv foretage de nødvendige rettelser (kaldet post-editing). Her har oversætter-en stadig hænderne på rattet og kontrol over processen. Der findes dog allerede nu software, som automatisk kan udføre post-editing. Og i fremtiden kommer der garanteret nye værktøjer på markedet, som vil kunne automatisere større eller mindre dele af oversættelsesprocessen.
Automatiseringsniveauer
I bilindustrien er man lykkedes med at gøre automatisering af kørsel forståelig, også for ikke-fagfolk, ved at introducere en taksonomi med seks automatiseringsniveauer. Den er udarbejdet af organisationen SAE International i 2018.
I en forsimplet udlægning kan man sige, at mennesket på niveau 0 fører bilen uden at få hjælp af et automatiseret køresystem. Føreren skal altså have fødderne på pedalerne og hænderne på rattet og holde øje med omgivelserne. På niveau 1 kan føreren enten fjerne fødderne fra pedalerne eller hænderne fra rattet under bestemte forhold. På niveau 2 kan systemet klare begge dele, men stadig kun under bestemte forhold, for eksempel ved vognbaneskift, og føreren skal fortsat holde øje med omgivelserne. På niveau 3 kan føreren fjerne øjnene fra vejen, men skal dog kunne overtage styringen ved problemer. På niveau 4 kan systemet selv løse problemerne, men kan kun køre under bestemte forhold, for eksempel når solen skinner og inden for et afgrænset område, som en parkeringsplads/lufthavn. På niveau 5 kan bilen køre helt selv alle steder og under alle forhold.
Niveauer af oversættelsesautomatisering
Inspireret af lighederne mellem selvkørende biler og oversættelsesmaskiner foreslår vi, at vi begynder at tale om niveauer af oversættelsesautomatisering. Oversættelsesautomatisering forstår vi som hardware- og softwaresystemer, som kan udføre alle taktiske og operationelle handlinger enten i dele af eller hele oversættelsesprocessen. Til dette formål har vi udviklet en taksonomi, som opererer med seks niveauer. Niveauet afhænger af, hvilke såkaldte ’features’ man aktiverer undervejs i processen, og af maskinens og menneskets roller.

På niveau 0 er det mennesket, der analyserer kildeteksten og producerer målteksten samt retter eventuelle fejl. Hvis man anvender ordbøger, er der ikke tale om en automatiseringsfeature, da de ikke ændrer eller overtager menneskets rolle. På niveau 1 kan en aktiveret feature analysere kildeteksten eller producere målteksten, men mennesket skal stadig rette alle fejl og uhensigtsmæssigheder (for eksempel tilpasse teksten til virksomhedens style guides). Hvis der opstår tekniske problem-er, er det mennesket, der skal løse dem. På dette niveau overtager systemet altså kun en del af oversættelsesprocessen. Et eksempel kunne være en oversættelseshukommelse, som analyserer kildeteksten og finder oversættelsesforslag. På niveau 2 kan featuren både analysere kildeteksten og producere målteksten, men mennesket skal rette eventuelle fejl og uhensigtsmæssigheder samt løse systemfejl. Et eksempel kunne være maskinoversættelse med efterfølgende menneskelig efterredigering. Dette er nødvendigt, fordi featuren ikke kan oversætte fejlfrit og/eller kun mellem bestemte sprogpar. På niveau 3 kan maskinen analysere kildeteksten, producere målteksten og selv rette fejl og andre uhensigtsmæssigheder, men mennesket skal være klar til at tage over, når maskin-en beder om det. Et eksempel kunne være en feature, der kan maskinoversætte og efterfølgende selv foretage nødvendige tilpasninger, men hvor mennesket skal reagere ved systemfejl. Samtidig er systemet begrænset til eksempelvis et bestemt fagområde eller en bestemt sprogkombination. På niveau 4 kan maskinen det hele selv, men der er stadig tale om et begrænset anvendelsesområde. På niveau 5 kan maskinen oversætte alle former for tekster mellem alle sprog på et professionelt niveau uden menneskelige involvering.
Kan taksonomien holde til en crash-test?
Det bliver spændende at se, hvem der når først i mål: selvkørende biler eller selvkørende oversættelsesmaskiner. Vi er ikke de eneste, der mener, at biler og oversættelsesmaskiner har noget tilfælles: Tesla-bagmanden Elon Musk har satset sine penge på begge dele. Han har nemlig været med til at udvikle den tekstgenererende kunstige intelligens GPT-3, som også kan oversætte. Nogle har kaldt den for et sprogtalent, men forsøg i en dansk kontekst tyder dog på, at der stadig er et godt stykke vej til, at GPT-3 ville kunne bestå en Turing-test.
Vi vil gerne understege, at vi hverken taler for eller imod førerløse oversættelsesprocesser. Vi siger blot, at vi bliver nødt til at forholde os til udviklingen og kunne italesætte teknologiernes fordele og ulemper. Det er blandt andet vores håb, at taksonomien kan være med til at gøre det klart, at oversættelsestjenester som Google Translate ikke er på niveau 5, men i mange tilfælde stadig kun på niveau 2, fordi maskinen blandt andet ikke selv kan rette fejl. Det er også vigtigt at sige, at taksonomien indeholder en række simplificeringer, og af nogle måske kan opfattes som en provokation. Den skal derfor helt sikkert udsættes for en crash-test. Måske vil du være testkører? ●
. . . . . . . . . . . . .
Deltag i et forskningsprojekt
Vi søger deltagere til crash-test.
Som led i vores forskningsprojekt afholder vi en række fokusgruppemøder.
Hvis du har lyst til at være med til at diskutere taksonomien og mener, at du kan bidrage konstruktivt til videreudviklingen af den, håber vi at høre fra dig.
Send gerne en mail til:
Tina Paulsen Christensen
(tpc@cc.au.dk)
Kristine Bundgaard
(kbundgaard@hum.aau.dk)