Dataanalys, eller om det kallas något annat, upptar tankarna för många just nu. Som för de flesta heta områden så innebär det stor dynamik med starka trender. Här presenterar CIO.com fem sådana trender.

1. Datasjöar måste bli lönsamma

I takt med att allt mer data genereras blir det allt jobbigare att hantera dem med traditionella datalager (data warehouses). Och värre lär det bli, speciellt om IOT slår igenom på allvar.

En lösning som dragit till sig mycket intresse under senare år är datasjöar (data lakes), till exempel med hjälp av en teknikplattform som Hadoop. Enkelt uttryckt handlar det om att lagra data i sina ursprungliga format någonstans, utan att tvätta, transformera och kvalitetskontrollera dem. De uteblivna aktiviteterna är tänkta att leda till snabbare, enklare och billigare hantering av data.

Och det blir snabbare, enklare och billigare med datasjöar. Men funkar de?

Problemet är att det kan vara svårt att analysera data i datasjöar. Anledningen till att man gör en massa extraarbete med traditionella datalager är just att förenkla dataanalys. Lägg till det att användningen av datasjöar ger sämre förutsättningar för realtidsanalyser än att jobba med strömmande data, av naturliga orsaker.

Man måste helt enkelt kunna visa att datasjöarna är lönsamma. Annars kommer de att försvinna.

Läs också: Dataanalys allt viktigare för marknadsförare – men många är sena ur startblocken

En alternativ väg att gå är att underlätta åtkomst till data i dess originalkällor. Man vill alltså undvika att flytta data, även till datasjöar. Det är förstås en stor utmaning att lyckas med det, eftersom data finns spridda i ett otal olika format, i ett otal olika databaser och andra lagringslösningar, på ett otal olika fysiska platser.

Inget nytt under solen här.

2. Digitalbossen stiger fram

Behovet av bättre dataanalyser ger en chans för dem som har titeln cdo (chief digital officer) att utmärka sig. Allt fler identifierar dem som möjliggörare, ibland kanske i högre utsträckning än cio:er.

En cdo kan ha bättre möjligheter att skapa en bra balans mellan centrala funktioner och funktioner som finns ute i verksamheten, och att få de olika delarna av verksamheten att betala för datalösningar som de faktiskt har nytta av. En cdo kan också se till att fördela sin tid mellan en central it-avdelning och de olika avdelningar som använder dess tjänster.

Kanske ska man uttyda cdo som chief data officer?

3. Dags för en datakurator?

Det är dags för ännu en ny yrkesroll, låt oss kalla den för datakurator. Datapsykolog kanske är att ta i?

En datakurator blir en förbindelselänk mellan konsumenter av data (dataanalytiker eller ”data scientist”) och de som jobbar med att flytta och transformera data. Analytikerna kanske använder verktyg som Tableau och språk som Python, medan den andra gruppen använder till exempel Spark, Hive och olika skriptspråk.

En datakurator måste alltså både förstå datas betydelse och de tekniklösningar som används för att hantera data. Datakuratorn måste ha koll på vilka analyser som behöver utföras, vilka data som behövs för analyserna och hur dessa data behöver hanteras.

4. Strategier för att hantera data blir livsviktiga

Egentligen räcker det med ett ord under den här punkten: GDPR.

Allt fler börjar inse vidden av aktiviteter som blir följden av införandet av GDPR 25 maj.

Läs också: Så fick analysföretaget Whispr Group in en fot i storföretagen – ”vi maskerade oss som digitalbyrå”

5. Metadata blir spretigare hela tiden

Trodde ni att ni skulle få ordning på metadata (data om data) på företaget när ni satsade på en svindyr lösning för ”master data management”? Lyckades ni?

Risken är stor att många inte lyckats få ordning på metadata. GDPR är bara ett av många skäl till att det blir allt viktigare att lyckas med det här. Ett annat är att datakaoset bara växer hela tiden. Det beror bland annat på att allt fler på företagen får tillgång till allt mer data.

Vad gäller dataanalys behöver man helt enkelt ha ordning på metadata för att veta var man kan hitta data som behövs för analyser och för att överhuvudtaget veta vilka data som finns tillgängliga.