Ett problem med AI i allmänhet och maskininlärning i synnerhet är att få tag på data för körningar. Man brukar säga att ungefär 80 procent av tiden i de flesta projekt går åt till att hitta, överföra, tvätta och strukturera data.
Nu är IBM på väg att gör något åt det här problemet, med en satsning som heter Watson Data Kits. Projektet är i betastadiet än så länge och det går att testa lösningen gratis.
Enkelt uttryckt kan man säga att det handlar om öppna data, på ett sofistikerat sätt. Det går ut på att IBM tillhandahåller behandlade data (tvättade och strukturerade) inom olika branscher. Det ska komma datamängder för rese-, transport- och livsmedelsbranscherna under andra kvartalet i år. Redan nu verkar det finnas data för resebranschen tillgängliga, i alla fall enligt en kom-i-gång-guide.
Läs också: Hybridmoln och Linux i fokus för nya Windows Server
Enligt IBM:s beskrivningar kan dessa resedata användas för att föreslå sevärdheter för olika resmål. Det ska innebära snabbare utveckling av AI-lösningar, ”från månader till minuter”.
Än är det tidiga dagar i det här projektet och vad gäller utveckling av AI-lösningar i allmänhet. Man kan till exempel undra om de data IBM släpper till en början är användbara i Sverige. Likaså om de är tillräckligt specifika för att vara användbara för att lösa verkliga problem, samt om de håller hög kvalitet. Och om IBM orkar med att få fram data för ett stort antal branscher och problemområden.
Men det är i alla fall en start. Nu återstår det att se om folk kommer att använda Watson Data Kits i hög utsträckning.