Forskare på Google har med hjälp av neurala nätverk lyckats ta fram en ny variant av talsyntes som gör det möjligt att behålla röst- och tonläge vid översättningar av tal, rapporterar MIT Technology Review.

Fram tills nu har den vanliga metoden varit att först omvandla ljud till text, sedan översätta texten till önskat språk och därefter omvandla texten till ljud på nytt, något som gör att det översatta talet inte alls låter som originalet.

TechWorld Summit 4 juni 2019, nätverka med 300 IT-proffs och få samtidigt en heltäckande överblick av den senaste tekniken

Den nya lösningen kallas för Translatotron och i korthet handlar det om att man kartlägger det som är karakteristiskt för en viss röst i form av ett spektrogram. Sedan integreras det med den översatta ljudfilen och resultatet blir en syntetisk röst som påminner mer om originalet. Som en bonus kan det även bli tal om färre översättningsmisstag, detta då antalet steg är färre.

Hittills har forskarna bara testat med att översätta mellan spanska och engelska, så det återstår en hel del innan tekniken kan användas kommersiellt.

Läs också:
Här är roboten som kan rensa ogräs – så man slipper kemikalier
De har byggt en AI-baserad valkompass – ”vårt sätt att väcka debatt”