Att det går att känna igen programmerares stil i skript, där källkoden finns i ”klartext”, är uppenbart. Men när källkoden har kompileras till maskinkod?

Jo, det går, skriver The Register och berättar om ett forskningsprojekt som drivs av bland annat Princeton. Det går alltså ut på att identifiera programmeringsstil baserat på den kompilerade maskinkoden.

Läs också: Google väcker nytt liv i Dart

Det blir möjligt genom att dekompilera maskinkoden till ett C-liknande språk och sedan köra maskininlärning på den resulterande koden. Det ska göra det möjligt att koppla samman koden med kända programmerare. Det fungerar alltså lite som signaturbaserade antivirusprogram.

Konsten, eller metoden, för att koppla samman källkod med programmerare kallas på engelska för ”source code stylometry”. Ska vi våga säga ”källkodsstilanalys” på svenska? Det har i alla fall forskats en del inom området. Och att analysera kod är ett arbetssätt som används i olika varianter.

Kontentan av det här är väl dels att det kanske kan bli lättare att identifiera folk som skriver skadlig kod, dels att det kan innebära problem för programmerare som har mer legitima skäl att vilja vara anonyma. Om man är lagd åt konspirationshållet kan man till exempel tänka sig att programmerare som bygger anonymiseringsläsningar som används av oppositionella krafter i totalitära stater kan få problem.

Läs också: Nya spännande tillskott till utvecklarens verktygslåda

Om du vill fördjupa dig i forskningsprojektet finns det en rapport här. Förutom forskare från Princeton, deltar även forskare från Shiftleft, Drexel University, Sophos, och Braunschweig University of Technology i projektet.