Att sortera data är en fundamental funktion i databassystem. För att mäta effektiviteten på sorteringen finns det måttstockar som kan användas för jämförelser. En sådan måttstock går ut på att sortera en terabyte data på så kort tid som möjligt och därefter spara ner allt på hårddisk. Google har slagit nytt rekord i den kategorin med hjälp av tekniken Mapreduce.

Sökjätten sorterade en terabyte på 68 sekunder, vilket kan jämföras med konkurrenten Yahoos senaste rekord på 209 sekunder. För att slå rekordet användes enligt uppgift 1000 servrar som arbetade parallellt.

Google provade också att sortera en petabyte data med hjälp av samma teknik. För detta kopplades 4000 servrar in. Sex timmar och två minuter senare var all data sorterad och sparad. Även det är siffror företaget säger sig vara nöjd med.

Google har i egenskap av sin webbaserade söktjänst samtidigt behov av att ständigt förbättra sina metoder och tekniker. Grzegorz Czajkowski, en av de ansvariga för företagets systeminfrastruktur, uppger att så tidigt som i januari detta år behandlade Google omkring 20 petabyte data varje dag.

Alla är dock inte imponerade. David DeWitt, professor i datavetenskap och numera anställd av Microsoft för att utveckla ett forskningslabb, menar att Mapreduce saknar nytäknande. Funktioner som databasadministratörer och utvecklare idag tar för givet finns inte ens med i Mapreduce, uppger DeWitt, som ändå ser vissa fördelar med att den är skalbar och robust.

IDG News

LÄS MER: