När man arbetar med data i den omfattning som till exempel Google eller Facebook gör, finns det ingen möjlighet att använda samma arkitektur som ett vanligt företag. Om man, som i Amazons lagringstjänst S3, har 450 miljarder objekt lagrade på disk behöver man ett väldigt stort system. Speciellt när kunderna gör uppemot 300 000 läs- och skrivoperationer – varje sekund! Hundratusentals nya virtuella maskiner lär startas varje dygn i Amazons molnplattform EC2.

För att en molnleverantör ska bli lönsam måste de krama ut så mycket som möjligt ur varje server. De dyraste resurserna – minne och processorer – ska helst vara 100 procent upptagna med att driva kundernas virtuella maskiner. Eftersom kundernas last varierar hela tiden finns det egentligen bara en lönsam princip för arkitekturen: Allt måste vara modulärt, och kapaciteten måste ändras i takt med behovet genom att man lägger till eller tar bort moduler. Sedan skadar det ju inte ifall modulerna också råkar vara billiga.


Ett datacenter som driver molntjänster åt Rackspace Ett stort datacenter som driver molntjänster åt Rackspace.

Hårdkör hårdvaran

Amazon är antagligen den leverantör som har gått längst i att maximera utnyttjandet av hårdvaran. När andra låter oss välja ett jämnt antal gigabyte arbetsminne, har Amazon fasta alternativ med udda storlekar som 1,7 eller 7,5 gigabyte. Anledningen är att hypervisorn som är installerad i botten också behöver en del minne, och en server som är bestyckad med 64 gigabyte minne har kanske bara 60 gigabyte ledigt för kundernas instanser. Att ständigt konsolidera last på så få servrar som möjligt och stänga av den hårdvara som inte behövs är rutin hos molntjänstföretagen.
De flesta iaas-leverantörer är ganska tystlåtna om hur deras infrastruktur och administrativa system fungerar, men en del undantag finns. Till exempel har Google publicerat flera forskningsrapporter om hur deras filsystem fungerar, och på konferenser händer det då och då att leverantörerna håller föredrag om sin teknologi.


Rackspace öppnade sig


John Engates, teknikchef Rackspace.

Rackspace, som driver en av de allra största molnplattformarna näst efter Amazon, har publicerat stora delar av sin mjukvara i öppen källkodsprojektet Openstack.

– Verktyg baserade på öppen källkod är mycket lättare att sälja in hos tjänsteleverantörer. Precis när vi skulle publicera koden för den första versionen av Openstack upptäckte vi att Nasa hade ett projekt som hette Nebula. De två projekten kompletterade varandra, och tajmingen var perfekt, berättar teknikchefen John Engates.

– Så Nasas mjukvara för att bygga beräkningsnoder kom med i Openstack, tillsammans med vår kod för lagringsservrarna. I dag använder Rackspace lagringsservrar exakt den mjukvara som är publicerad i Openstack, och senare i år ska vi ha bytt ut vår gamla kod för beräkningsnoderna till Nebula.

När det gäller själva servrarna där kundernas virtuella maskiner huserar, är faktiskt inte särskilt mycket specialbyggt. Det gäller bara att ha tillräckligt många av dem – tiotusentals, eller ännu fler. Alla leverantörerna har också någon sorts externt api, där kunderna kan beställa nya instanser och styra dem som redan är startade. Men för att övervaka och kontrollera belastningen behövs en hel del logik, och på det området är alla ganska försiktiga med att avslöja detaljer om hur de arbetar. Till exempel har Openstack-projektet bara offentliggjort en förenklad version av planeringsmotorn med ett minimum av intelligens.


Alla kör Linux
Av de fem iaas-leverantörer som testas på sidan 30 i det här numret av TechWorld använder samtliga Linux i sina plattformar. Amazon, Rackspace och City Network använder hypervisorn Xen, medan Cloudsigma och Glesys kör KVM.

John Engates berättar att Rackspace strävar efter att minimera overheadkostnaderna.

– Ursprungligen använde vi en gratis-paketering av Xen, men sedan några år tillbaka har vi börjat använda Citrix Xenserver. Det är en kommersiell paketering, och de hade mycket bättre stöd för Windows-gäster i sina drivrutiner och verktyg. Prestanda försämrades inte, och dessutom har Citrix bidragit mycket till Openstack-projektet.


Fredrik Rynger, VMware.

Men de produkter som man brukar hitta i företags serverhallar, som Hyper-V och VMware, lyser med sin frånvaro. Vi frågade Fredrik Rynger, regionchef på VMware, hur det kommer sig:

– VMware har många kunder som levererar molntjänster, ungefär femtio stycken här i Sverige. Vissa av dem debiterar också per timme. Men publika molnleverantörer har en lägre sla-nivå än privata moln, och tar mindre betalt, vilket leder till prispress, berättar han, och fortsätter:

– Även stora företag har interna moln, och där är integrationen viktig. En avdelning i Kiruna måste kunna använda ledig kapacitet i Malmö om de behöver. Alla organisationer måste ha full koll på sina data, och då är hybrider huvudspåret. Man har kvar sina viktigaste och mest känsliga it-system internt, men kompletterar genom att till exempel lägga ut test- och utvecklingssystem i publika moln.

Sida 1 / 3

Innehållsförteckning

Fakta

  • GFS, Google File System: Ett egenutvecklat distribuerat filsystem från Google, som är gjort för att kunna utnyttja resurserna hos många servrar samtidigt.
  • iaas, infrastructure as a service: Molntjänst där du får full tillgång till virtuella maskiner, nätverk och lagring.
  • horisontell skalning: När man ökar kapaciteten genom att lägga till flera datorer. Motsats till vertikal skalning, där man i stället använder en större dator.
  • pekare: en referens som anger var man kan hitta information, till exempel en fil.
  • rest, representational state transfer: Modell för hur klientapplikationer kan kommunicera mot servertjänster över protokollet http.