Att maskininlärning är avancerad hantering och analys av data, av alla de sorter, som faller under paraplybegreppet AI börjar sjunka in i medvetandet hos de flesta. Men hur många har koll på vilka olika typer av maskininlärning som finns?

En indelning får man med följande tre kategorier:

  • Övervakad inlärning (supervised learning).
  • Oövervakad inlärning (unsupervised learning).
  • Förstärkt inlärning (reinforcement learning).

När man ska försöka bena ut vad som skiljer typerna åt är det lätt hänt att virra bort sig i abstrakta beskrivningar. Här är ett försök att bringa klarhet:

Övervakad inlärning innebär att man förfinar en algoritm, genom att träna den med utgångspunkt i en datamängd och ett i förväg känt ”rätt svar”.

Oövervakad inlärning innebär att komma fram till en funktion som beskriver ej kategoriserade data, utan att ha något känt svar som facit. Man kan alltså inte kontrollera den resulterande funktionen gentemot ett känt svar.

Läs också: Så kommer du igång med AI – innan tåget har gått

Förstärkt inlärning innebär att en mjukvara (kallas agent), eller flera, lär sig den rätta lösningen genom att prova sig fram och förstärka beteenden som leder till positivt resultat och försvaga beteenden som leder till negativt resultat. Det här kan göras utan att ha tillgång till förberedda data.

Av de här tre är förstärkt inlärning den typ som hamnat minst i rampljuset hittills och mest synts i nischtillämpningar, skriver Infoworld. Men det håller på att förändras. Metoden passar bra i sammanhang när agenter behöver komma fram till optimala lösningar i en viss miljö.

Ett exempel på en sådan miljö är en IoT-lösning som innefattar självständigt arbetande applikationer i det yttre skiktet, vilket kallas ”autonomous edge applications”. Detsamma gäller för lösningar för transport, sjukvård, med mera, som innehåller robotar i ytterkanterna. Ytterligare användningsområden finns i it-drift, energisektorn och finansiell handel.

Men det mest spännande området är kanske djup förstärkt inlärning (deep reinforcement learning). Det innebär att autonoma agenter använder förstärkt inlärning för att träna neurala nätverk. AI som tränar en AI, med andra ord. Och sådana kan användas för att träna lösningar för maskinlärning som bygger på övervakad eller oövervakad inlärning.

Om det här låter snurrigt kan man tänka på det som automatisering av AI-utveckling.

Ett annat sätt att bygga lösningar för maskininlärning som vinner gehör är att kombinera de olika ansatserna (övervakad, oövervakad och förstärkt) i hybridlösningar.

Läs också: Här är de fem stora AI-trenderna 2018

Ett exempel på när en hybridlösning kan komma till pass är att övervakad inlärning inte är till någon nytta om det saknas kategoriserade data. Ett annat att oövervakad inlärning som bygger på att kategorisera data kanske inte är lämplig för att fatta beslut baserade på flöden av sensordata.

Det finns ett antal ramverk för att jobba med förstärkt inlärning, till exempel Tensorflow Agents.

Förstärkt inlärning är kanske inte det första området den som börjar med maskininlärning ger sig på. Övervakad inlärning känns säkert enklare för många, eftersom man har både tillrättalagda datamängder och önskade svar att utgå ifrån. Men på sikt bör en person som jobbar maskininlärning ha nytta även av förstärkt inlärning.