Att ramverket Hadoop och andra öppna lösningar från organisationen Apache Software Foundation ligger i frontlinjen för att skapa lösningar för big data är välkänt. Likaså att det kan vara väldigt krångligt att skapa fungerande lösningar byggda på alla de olika Apacheramverken.

Men nu ska det bli ändring på det, åtminstone vad gäller Hadoop. Organisationen Open Data Platform Initiative, ODPI, släpper ODPI Runtime Specification 1.0. Det är en specifikation för att bygga miljöer baserade på version 2.7 av Hadoopramverket. Om man följer specifikationen ska det gå att flytta Hadoopapplikationer mellan olika installationer av Hadoop. Det innebär dels att kunder ska kunna byta leverantörer av olika teknikkomponenter för Hadoopmiljöer, dels att företag som utvecklar Hadoopapplikationer och de som tillhandahåller Hadoopimplementationer ska kunna vara säkra på att deras produkter fungerar i Hadoopmiljöer som följer specifikationen.

Läs också: 13 färdigheter som är ett måste för en topputvecklare

Specifikationen beskriver hur källkod ska se ut, men ska vara flexibel vad gäller hur Hadoopmiljöer konfigureras. Det ultimata målet är att Hadoopapplikationer ska kunna ”testas en gång, köras överallt”.

För att uttrycka det enkelt ska ODPI Runtime Specification garantera kompatibilitet i Hadoopvärlden. Det är något som vissa, bland annat medlemmarna i ODPI, menar har varit en bristvara. Andra, som vissa företag som inte är medlemmar i OPDI, hävdar att det här inte alls är ett problem.

Det största hindret mot att specifikationen ska slå igenom lär inte bli hur tekniskt duglig den är, utan vilket stöd den får från viktiga aktörer i Hadoopvärlden. Som det ser ut i dag finns det tre ledande leverantörer av Hadoopplattformar: Hortonworks, Cloudera och Mapr Technologies. Av dessa är endast Hortonworks medlem i ODPI och det är också Hortonworks som är drivande i arbetet med att skapa specifikationer.

Visserligen finns det en del andra prominenta medlemmar, som IBM, EMC och Sas Institute, men avsaknaden av Cloudera och Mapr innebär att ODPIs specifikation aldrig lär få fullt genomslag. Att Apache lyser med sin frånvaro är naturligtvis också ett minus för ODPI.

Läs också: Larvig lanseringstakt för datatjänster gör det svårare att välja rätt

Ett annat potentiellt hinder för framgång för specifikationen är att Hadoop ser ut att minska i betydelse, till förmån från andra lösningar, till exempel ramverket Spark som också kommer från Apache.

Men om kompatibilitetsproblemen med Hadoop verkligen är kännbara borde ODPIs specifikation bli en framgång, även om inte Cloudera och Mapr ansluter.