Microsoft berättar om sin AI-bedrift i ett blogginlägg. Där hänvisar man till ett översättningstest som både AI-lösningen och två mänskliga översättningsexperter fått göra. Man har ännu inte offentliggjort några resultat från AI-översättning i realtid. Men man kan undra vad som skulle utmärka ett sådant användningsscenario, jämfört med att översätta äldre texter.

Maskinöversättning är ett hett område, med flera intressanta nya lösningar. För att lyckas med sitt projekt har Microsofts team använt flera olika metoder:

Dubbel inlärning. Innebär helt enkelt att AI-lösningen först översätter och sedan översätter människor tillbaka till originalspråket. Den andra översättningen används sedan av AI-lösningen för att förbättra sig själv.

Redigeringsnätverk, eller överläggningsnätverk (deliberation networks). Det är en metod som påminner om hur människor redigerar texter i flera omgångar. AI-lösningen fick upprepa översättningen av en mening, för att gradvis förbättra den.

Gemensam träning (joint training). Går ut på att översätta nya meningar flera gånger fram och tillbaka mellan de båda språken. Det gör att båda översättningslösningarna blir bättre.

Formell överenskommelse (agreement regularization). Går ut på att AI-lösningen översätter en mening både från vänster till höger och från höger till vänster. Om de båda översättningarna blir de samma anses de hålla hög kvalitet. Metoden blir nog svår att använda för till exempel svenska.

Läs också: Sydkorea kan bli först ut med robotskatt

Forskaren Ming Zhou som jobbar på Microsoft berättar att maskinöversättning är ett mycket mer komplext område än till exempel mönsterigenkänning. Det beror inte minst på att det ofta inte finns några rätta svar vad gäller översättning. Även två skickliga mänskliga översättare kan komma fram till olika korrekt och lika bra resultat. Det finns ofta mer än ett ”rätt sätt” att säga en sak.

”Kinesiska”, eller förenklad kinesiska, är egentligen en familj med språk vars utövare inte alltid kan prata med varandra, men som har samma skriftspråk. Det borde göra att Microsofts AI-lösning i praktiken faktiskt täcker in ett antal olika ”språk” och dialekter.