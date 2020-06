AI, eller artificiell intelligens, öppnar upp en värld av möjligheter för applikationsutvecklare. Genom att dra nytta av maskininlärning eller djupinlärning kan du skapa betydligt bättre användarprofiler, personalisering och rekommendationer, smartare sök, röststyrda gränssnitt eller en intelligent assistent, eller förbättra din app på ett otal andra sätt. Du kan till och med bygga applikationer som kan se, höra och reagera på händelser du aldrig kunnat förutse.

Vilket programmeringsspråk bör du välja för att djupdyka i AI-oceanen? Du vill naturligtvis använda ett språk som har många bra bibliotek för maskin- och djupinlärning. Men språket bör också ge bra runtime-prestanda, stödja bra verktyg, samla en bred skara utvecklare och ett levande ekosystem av stödjande paket. Även om det låter som en tuff kravlista finns det fortfarande gott om kandidater.

I denna artikel plockar jag ut de sex främsta språken för AI-utveckling, plus ett par språk som är värda att nämna. Vissa av dessa språk är på uppåtgående, medan andra tappar i popularitet. Ytterligare andra behöver du bara känna till om du är intresserad av historiska arkitekturer och applikationer för djupinlärning.

Python

Python, Python och åter Python. Hur skulle det kunna vara något annat, egentligen? Ok, det kanske finns saker med Python som gör dig tokig, men jobbar du med AI kommer du förr eller senare till en punkt där du kommer använda Python. Och en hel del irritationsmoment med Python har blivit bättre.

Vi skriver 2020 och problematiken kring Python 2.x kontra 3.x blir allt mer obetydlig eftersom i stort sett alla bibliotek stödjer 3.x och släpper stödet för 2.x så fort de bara kan. Med andra ord kan du äntligen, på riktigt, dra nytta av alla nya egenskaper och funktioner i språket.

Medan Pythons paket-trassel, där varje lösning är trasig på lite olika sätt, fortfarande finns där, kan du ändå använda Anaconda typ 95 procent av alla gånger och inte bry dig om saker och ting alltför mycket. Men det vore förstås bra om python-världen kunde lösa de här surdegarna en gång för alla. Anaconda är en distribution av Python tillsammans med programmeringsspråket R (se nedan) med inriktning på datavetenskaplig programmering.

Med det sagt, matematik- och statistik-biblioteken i Python saknar i stort sett jämlikar i andra språk. NumPy är till exempel så allmänt förekommande att det nästan fungerar som ett standard-api för tensor-operationer, och Pandas för in R-språkets kraftfulla och flexibla dataramar till Python. För behandling av naturliga språk (natural language processing, nlp) finns det ärevördiga biblioteket NLTK och det blixtsnabba SpaCy.

För maskininlärning har du tillgång till det erkända biblioteket Scikit-learn, och när det kommer till bibliotek för djupinlärning så är Python förstahandsvalet, det första språk man skapar biblioteken för, inom projekt som TensorFlow, PyTorch, Chainer, Apache MXNet, Theano med flera.

Om du läser om de senaste forskningsrönen inom djupinlärning på arXiv kommer du se att en majoritet av alla forskningsstudier som ger ut kod, gör det i Python. Sen finns det andra delar av ekosystemet kring Python som också är till nytta. Många jobbar till exempel med Jupyter Notebook, ett populärt system för att dela kod och projekt, där Python är det dominerande språket, och nuförtiden har arkitekturer för mikrotjänster, med verktyg som Seldon Core, gjort det betydligt enklare att sjösätta och produktionssätta sina modeller.

Det går inte att komma runt Python. Språket ligger i framkant av AI-utvecklingen, och det språk där du finner flest ramverk för maskin- och djupinlärning. Det är också ett språk som nästan alla i AI-världen ”pratar”. Python är AI-språket nummer ett, även om det emellanåt ger upphov till en del svordomar.

C++

C++ är kanske inte ditt förstahandsval när det kommer till att utveckla AI-applikationer, men om du behöver krama ut maximal prestanda kan det vara läge att än en gång gå tillbaka till den skrämmande världen av pekare. Detta är ett scenario som blir alltmer vanligt när djupinlärning når allt längre ut i kanterna, ut på klinter, IoT-system och inbäddade system, där systemresurserna är betydligt mer begränsade.

Tack och lov kan modern C++ ärligt talat vara en relativt behaglig upplevelse. Det finns olika sätt att ta dig an C++. Du kan antingen djupdyka ned i botten av stacken och använda bibliotek som Nvidias CUDA för att skriva din egen kod som kör direkt på en GPU, eller så kan du använda TensorFlow eller PyTorch för att få tillgång till flexibla högnivå-api:er. Både TensorFlow och PyTorch tillåter dig att ladda modeller som skapats i Python och köra dem direkt i C++-miljön (runtime). Detta gör att du kommer närmare ”järnet” i produktionen, samtidigt som du behåller flexibiliteten i utvecklingen.

C++ blir en viktig del av verktygslådan när AI-applikationer breder ut sig över allsköns enheter, från de minsta inbyggda systemen, till jätte-kluster. AI ute på randsystemen betyder att det inte längre räcker att vara noggrann, man måste var noggrann och snabb.

Java och andra JVM-språk

Familjen av JVM-språk (Java Virtual Machine) som Java, Scala, Kotlin, Clojure et cetera fortsätter att vara ett utmärkt val för utveckling av AI-applikationer. Det finns en bred flora av bibliotek att tillgå för alla delar av processen, till exempel CoreNLP för NLP, ND4J för tensor-operationer eller en fullt GPU-accellererad stack för djupinlärning som DL4J. Dessutom får du enkel tillgång till big data-plattformar som Apache Spark och Apache Hadoop.

Java är som ett universalspråk inom de flesta företag och organisationer, och med de nya konstruktionerna från och med Java 8 och framåt, är det inte en lika frustrerande upplevelse att skriva java-kod som många av oss minns. Det kanske inte blir lika spännande att skriva en AI-applikation i Java, men det kan bidra till att få jobbet gjort, och du kan använda all existerande infrastruktur kring Java som din organisation förmodligen redan har.

JavaScript

Det är inte så troligt att du kommer lära dig JavaScript bara för att skriva AI-applikationer, men Googles TensorFlow.js är under fortsatt utveckling och förbättring och erbjuder ett intressant sätt att utveckla dina Keras- eller TensorFlow-modeller för webben, eller genom Node.js med hjälp av WebGL för GPU-accelererade beräkningar.

Med det sagt har vi inte riktigt sett en större migration av JavaScript-utvecklare till AI-området, ens sedan släppet av TensorFlow.js. Orsaken kan ligga i att det omliggande ekosystemet kring JavaScript inte innehåller samma djup av tillgängliga bibliotek i jämförelse med språk som Python.

Dessutom, om vi tittar på server-sidan, så ligger det inga större fördelar i att sjösätta modeller med hjälp av Node.js jämfört med någon av motsvarigheterna inom Python. Så inom den närmaste framtiden är det främst inom webbläsarbaserade AI-applikationer vi kommer att få se JavaScript. Men det ger också fantastiska möjligheter för saker som Emoji Scavenger Hunt.

Swift

Swift är absolut ett språk att hålla ögonen på. Bara på ett år har mycket hänt. Swift for Tensorflow är ett språk med starka datatyper och en okomplicerad bindning till det senaste inom Tensorflow och en närmast magisk funktion som gör att du kan importera python-bibliotek som att du använda Python från början.

Teamet bakom Swift jobbar på en egen implementation av det populära biblioteket, och flyttar en del smarta funktioner från Tensorflow till kompilatorn LLVM så att vi ska kunna ta del av fler optimeringar i hur man genererar och kör modeller. Är Swift redo för produktion. Inte riktigt ännu, men det pekar ut en väg framåt mot nästa generations utveckling av djupinlärning, så du bör absolut kolla vad som händer inom Swift.

R

Programmeringsspråket R kommer i botten av listan, och R trendar nedåt. R älskas av datalogi-forskare, men andra programmerare tycker ofta att R är förvirrande på grund av språkets centrering kring dataramar. Om du har tillgång till en grupp R-programmerare kan det vara vettigt att använda integrationer med Tensorflow, Keras eller H2O för forskning, prototyper och experimenterande, men det är tveksamt att rekommendera R för produktion eller för utveckling av helt nya applikationer.

Även om du kan skriva R-kod som ger goda prestanda på produktionsservrar, blir det antagligen enklare om du tar en prototyp skriven i R och kodar om den i Java eller Python.

Andra språk för utveckling inom AI

Så klart är ovan nämnda språk inte de enda som kan komma till användning inom AI-utveckling. Här kommer två språk som kan vara intressanta och till hjälp, utan att de tillhör de språk som är mer värda att lära sig.

Lua

För några år sedan var Lua hett inom AI-utveckling tack vare ramverket Torch, ett av de mest populära biblioteken inom maskininlärning för både forskning och produktion. Om du dyker ned i historien om djupinlärningsmodeller kommer du stöta på en massa referenser till Torch och Lua-kod i gamla repos på Github. Det kan vara värt att ha viss kunskap om Torch-api:et, som inte ligger så långt från PyTorch-api:et, men såvida du inte måste ta in en massa historik i din applikation klarar du dig bra utan Lua.

Julia

Julia är ett vasst språk inom den matematiktunga AI-världen eftersom det är ett språk gjort för programmering av tunga beräkningar inom numerisk analys. Även om Julia just nu inte är så populärt finns det paket som TensorFlow.jl och Mocha vilka ger bra stöd för djupinlärning. Om du klarar dig med ett relativt litet ekosystem, och behöver dra nytta av Julias fokus på att snabbt och enkelt bygga högprestandaberäkningar så är Julia helt klart värt att titta på.

