Data är den nya råvaran, och maskininlärning är kraften som driver den. Den som har kontroll över dessa två aspekter kommer att ha stor inverkan på världen.
Detta är inte en överdriven fras från en dystopisk berättelse, utan en reflektion av verkligheten.
Den nya världsordningen handlar om att samla in stora mängder relevant information och omvandla den till användbara insikter. Detta är något som mänskligheten tidigare inte har haft möjlighet att göra. Det är tekniken som kan ge ett land ett försprång och potentiellt en ledande roll i världen.
Därför tar progressiva nationer detta på största allvar.
En lukrativ karriärväg
Oavsett internationella maktspel, är datavetenskap och maskininlärning ett eftertraktat område med enorm potential. Efterfrågan är enorm, och det finns en brist på kvalificerade dataforskare, även de medelmåttiga.
Det är som om vi plötsligt har upptäckt många nya beboeliga planeter, men vi saknar människor som kan flytta dit. Jag skulle kunna upprepa detta, men jag tror att följande infografik illustrerar det bättre:
Källa: insidebigdata.com
Vi kan se att lönerna börjar vid över 50 000 dollar och för chefer kan de överstiga 250 000 dollar.
Dessutom genererar den genomsnittliga personen på jorden cirka 1,7 MB data per sekund, vilket under en livstid blir över 3500 TB. Detta är mer data än vad vi för närvarande vet hur vi ska hantera eller analysera. Att säga att framtiden ser ljus ut är en underdrift.
Är datavetenskap och maskininlärning svårt?
Det är en bra fråga.
Enligt min erfarenhet är svaret både ”ja” och ”nej”.
Artificiell intelligens (och därmed maskininlärning) är mycket krävande om man vill bedriva forskning och tänja på gränserna. För sådant arbete krävs mer än en doktorsexamen i datavetenskap och matematik. Men de flesta har varken ambition eller tid för en sådan strävan.
Å andra sidan finns det något jag skulle kalla tillämpad datavetenskap och maskininlärning.
Det handlar om att använda befintliga verktyg, tekniker och algoritmer för att lösa verkliga problem. Detta kräver engagemang, insikt och kreativt tänkande, samt viss grundläggande matematisk förståelse, som snabbt kan läras in. Men när det gäller den faktiska ”tekniska” kunskapen är det mycket mindre krävande än ett jobb som mjukvaruingenjör.
Det är inte en enkel uppgift, men med tanke på förhållandet mellan ansträngning och belöning är det en av de bästa investeringarna du kan göra.
Nu när du är motiverad att bli dataforskare eller maskininlärningsingenjör, låt oss utforska de bästa utbildningsalternativen.
Maskininlärning (Google)
Få vet om det, men Google erbjuder en omfattande, praktisk och kostnadsfri kurs i maskininlärning. Enligt företaget är det en del av deras engagemang för att utveckla AI/ML-teknologier och sprida kunskap.
Det bästa med kursen är att det inte krävs några förkunskaper, men var beredd på att lägga extra tid på att fördjupa dig i statistik. Det är inte absolut nödvändigt, men om du saknar bakgrund i statistik kan förklaringarna vara otillräckliga. Kursen introducerar maskininlärning via TensorFlow, en implementering av ML utvecklad av Google. Google marknadsför sina API:er, men med tanke på kursens värde är det inget problem. TensorFlow är ett enkelt sätt att börja med ML och är mycket populärt.
Datavetenskap
Namnet Harvard inger respekt, liksom den här kursen.
Det är inte en enkel kurs där du snabbt lär dig maskininlärning genom att skriva ett kodsnutt här och där. Det är en strikt utmaning som kräver hårt arbete och tid.
Kursen erbjuder gratis videor, kod (finns på GitHub) och lösningar på labbuppgifter. Det finns inget som begränsar dig om du vill lära dig.
Vem passar kursen?
Du – jag skojar inte.
Jag rekommenderar den till yrkesverksamma med god matematisk bakgrund, även om de inte är särskilt intresserade av matematik längre. Vanan att resonera och bevisa är viktig. Men var beredd: den här kursen är tuff. Övningsuppgifterna är utmanande, men det är kanske just det du söker!
Maskininlärning
Gå in i en bar fylld med dataforskare och fråga vem Andrew Ng är. Du kommer garanterat att få respekt.
Andrew Ng har uppnått en närmast gudomlig status i datavetenskap och maskininlärningskretsar, tack vare sin kurs på Coursera – Maskininlärning.
Om du tvivlar på Andrew Ngs meriter talar detta för sig självt:
Det är en betald kurs, men ekonomiskt engagemang och beslutsamhet är inte de enda kraven. Det är en omfattande kurs där Andrew går djupt in i matematiken bakom ML och dissekerar populära algoritmer. Men det är en komplett kurs som leder dig steg för steg genom det svåraste.
Jag rekommenderar den starkt, det är nästan en statussymbol att ha klarat den!
Tillämpad datavetenskap
Specialiseringarna på Coursera är serier av kurser som syftar till att ta dig från nybörjare till expert inom ett visst område. Om du söker en komplett och vänlig kurs i datavetenskap och maskininlärning med Python rekommenderar jag starkt den här specialiseringen.
Vid kursens slut får du ett certifikat.
DataCamp
DataCamp erbjuder många kurser i datavetenskap, inklusive olika kompetens- och karriärvägar. Du får hjälp av erfarna dataforskare i Python och R, från datahantering till maskininlärning.
Med DataCamps omfattande material kan du lära dig i din egen takt. Kurserna ger praktisk erfarenhet som förbättrar dina datavetenskapliga färdigheter.
Du kan prova gratisversionen och utvärdera kursen genom att titta på det första kapitlet.
edX
Lär dig av MITx, Harvardx, IBM, RICEx, UCSanDiegox och GTx på edX-plattformen.
Dessa organisationer har en omfattande läroplan som ger dig kunskaper i datavetenskap. Programmen passar dig som har bakgrund i statistik eller datavetenskap.
Om du inte letar efter ett program kan du välja kurser separat. På edX finns det över 200 kurser relaterade till datavetenskap, som täcker Python, R, Excel, sannolikhet, statistik, maskininlärning, datavisualisering och mycket mer.
Codecademy
Codecademy är en annan plattform som är ett av de bästa systemen för att lära sig koda. De tror på ”lär dig genom att göra” och erbjuder många övningsprojekt och tester.
Deras datavetenskapskurs inkluderar SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn och många fler bibliotek.
Hela karriärvägen innehåller 26 kurser som är mer än tillräckligt för att hjälpa dig bli en framgångsrik dataforskare.
Den här kursen:
- Ger djupgående kunskaper i datavetenskap
- Ger en lättförståelig färdplan
- Förbereder dig för arbetslivet genom att ge tillräcklig praktisk erfarenhet
Udemy
Udemy behöver ingen introduktion.
Python för datavetenskap och maskininlärning Bootcamp på Udemy är en av de mest populära kurserna med över 85 000 betyg (4,6) och 370 000+ studenter.
Följande ämnen tas upp i kursen:
Kursen innehåller följande:
- 25 timmars video on demand
- Full livstidsåtkomst
- 13 artiklar och fem nedladdningsbara resurser
- Tillgång via mobil och tv
- Intyg om slutförande
- 30 dagars pengarna-tillbaka-garanti
Om du vill ha en prisvärd kurs är det ett bra alternativ.
Google AI
Skulle du vilja lära dig maskininlärning från ML-experter på Google?
Kolla då in kurserna på Google AI.
Plattformen erbjuder kurser och material om maskininlärning och datavetenskap för studenter, mjukvaruingenjörer, dataforskare och forskare. Kurserna är gratis.
En bra start är Kraschkurs i maskininlärning på Google AI. Det är en snabbkurs med praktisk introduktion med TensorFlow API:er. Här är kursens detaljer:
Plattformen har också specifika kurser om viktiga ML-ämnen, som klustring, rekommendationssystem, testning och felsökning i maskininlärning, dataförberedelse och funktionsteknik i maskininlärning. Om du kan grunderna i maskininlärning är dessa kurser mycket användbara.
Udacity
Udacity är en populär e-lärandeplattform med många kurser om aktuella tekniker. De har flera branschledande program som har skapats och erkänts av stora företag som AT&T, AWS, Google och IBM.
Ett av programmen på Udacity är School of Data Science. Det här programmet hjälper dig att få jobb som dataanalytiker, dataforskare, dataingenjör och affärsanalytiker. Kursen om Data Scientist täcker maskininlärning, djupinlärning och mjukvaruteknik. Du behöver grundläggande kunskaper om maskininlärning för att välja den här kursen.
Om du kan Python men är ny inom maskininlärning, finns det ett annat program på Udacity – School of AI. Det programmet har kurser som börjar med grunderna i maskininlärning.
Djupinlärning
Den här kursen är en guldgruva, och min favorit på den här listan om du kan koda.
Jag upprepar: om du kan koda.
Kursen lägger inte tid på att lära ut grunderna i programmering. Kursbeskrivningen säger det tydligt:
Vi antar att alla som går den här kursen har minst ett års erfarenhet av att koda. Kursen använder Python, så om du inte kan Python förväntas du lära dig det själv. För en erfaren kodare borde Python vara ett enkelt språk att lära sig.
Om du kan Python (eller snabbt kan lära dig det här) är det en perfekt kurs för praktiker som vill bygga verkliga system utan att oroa sig för mycket för den teoretiska bakgrunden till algoritmerna.
Den är för de otåliga som hatar onödiga formaliteter och monotoni.
Och, har jag nämnt att den är 100 % gratis och har en fantastisk gemenskap?
Sammanfattning
Puh!
Det var en svår lista att sammanställa. Inte för att det saknades bra resurser, utan för att det fanns alldeles för många.
Maskininlärning är ett område som har exploderat och löser svåra problem på ett elegant sätt. Det finns hundratals kurser online, både gratis och betalda, och de flesta är mycket bra. Men det kan också vara förvirrande, vilket är anledningen till att jag har försökt koka ner det till elva kurser för olika typer av studenter beroende på erfarenhetsnivå.
Jag hoppas att det hjälpte!