Att man måste övervaka driften av applikationer och tjänster är självklart. Men vad, förutom akuta larm om problem, bör man ha koll på?

Det här är en fråga som aktualiseras på många företag som gör devopssatsningar. Där är det vanligt att personal som tidigare haft renodlade uppgifter inom utveckling nu även får ansvara för drift. I ett sådant läge kan det vara svårt att veta vilka mätetal som är viktiga.

Oskar Stål som tidigare varit teknikchef på Spotify och numera har titeln ”vice president user engagement” på samma företag har haft all anledning att fundera på det här.

Oskar Stål, Spotify.
Oskar Stål, Spotify.

– Upptid per tjänst är ett viktigt mätetal, vi uttrycker det som tillgänglighet per månad i procent. Även svarstider är viktiga, om de försämras är det antagligen problem med kapacitet av något slag. Ett exempel är att det kommer larm om att svarstiderna för en sökfunktion ökar för ett visst datacenter, säger Oskar Stål.

Ett annat intressant mätetal för Spotify är frekvensen av felmeddelanden:

– Det handlar oftast inte om att någon funktion försvinner, utan om att den går långsammare och långsammare, eller att frekvensen för felmeddelanden ökar, förklarar Oskar Stål.

Om antalet felmeddelanden ökar eller det går långsammare är nästa steg så klart att försöka ringa in vad som krånglar och var.

Läs också: 9 goda råd för att ta fram en perfekt plan mot cyberattacker

Även mindre tjänsteleverantörer måste ha koll på viktiga mätetal. Konstrukt som erbjuder molntjänster för ekonomisk planering är ett exempel.

Iris Classon, Konstrukt.
Iris Classon, Konstrukt.

– Vi har koll på alla anrop som görs för tjänsterna, till exempel sådana som leder till databasanrop är viktiga. Det finns maxgränser för vissa anrop, annars blir det timeouter, berättar Iris Classon, utvecklare på Konstrukt som är engagerad i driften.

Hon berättar vidare att man har fått lägga tid på att diskutera vem som ska ansvara för larm och mätetal, och inte minst hur man ska agera om värdena indikerar problem. Det här är saker som inte alltid är uppenbara för relativt nystartade företag som inte har lång vana av it-drift.

Exemplen ovan kanske känns uppenbara, men det kan vara lätt att gå vilse i en djungel av mätetal. Ett sätt att skapa struktur är att kategorisera mätetal för it-drift och sedan välja ut de mest relevanta inom de olika kategorierna.

Läs också: Nu tar devops-bottarna över it-driften

Det finns så klart gott om olika definitioner av kategorier för mätetal. Här följer några exempel från Computer Swedens systersajt CIO.com:

  • Sett från ett användarperspektiv märks till exempel svarstider och tillgänglighet. Det är viktigt att ha koll på hur mätetalen varierar. Beroende på vilken verksamhet det är kan det vara viktigt att prioritera mätning av vissa applikationer och tjänster. Det kan även vara olika viktigt att mäta olika tider på dygnet.
  • Andelen lyckade batchjobb.
  • Antalet driftsincidenter, eventuellt sorterade efter hur allvarliga de är.

Företag som lyckas få ett grepp om de här grundläggande mätetalen kan sedan gå vidare med att mäta till exempel finansiella aspekter och tidsaspekter. Eller för att tala ren svenska, är it-driften dyr och håller man tidsplaner för förändringar som genomförs?