Python og Machine Learning
Beskrivelse
Kurset gennemgår best practices og løsninger indenfor machine learning og statistik i Python.
Python er hos mange udviklere og data scientists blevet det foretrukne sprog til at håndtere machine learning og Big Data. Det hænger i høj grad sammen med sprogets objektorienterede mekanismer, der gør det logisk og enkelt at håndtere store datamængder uden at skulle kode alt fra bunden.
På dette kursus får du øvelse med at normalisere og forme datasæt, så det kan bruges af Pythons forskellige beregningsmodeller. Det er nemlig centralt, at man sikrer, at det data man læser ind i Python overhovedet giver mening. Hertil anvender vi de grundlæggende moduler NumPy og Pandas, der giver hele det matematiske grundlag for machine learning.
Desuden giver kurset et forkromet overblik over machine learning moduler i Python, så du er bedre rustet til at vælge og skelne mellem de forskellige beregningsmodeller, der findes i Pythons store samling af machine learning moduler, som f.eks. scikit-learn og Keras.
På kurset får de de fundamentale beregningsmodeller som regressions- og gauss-modeller til at give brugbare resultater, og samtidig lærer du, hvordan de fungerer, og hvornår du skal vælge den ene model fremfor den anden.
Herudover får du hands-on erfaring med at udvikle fuldt trænede machine learning modeller, og vi simulerer, at de går i drift ved at loade ny data ind i systemet, hvilket svarer til, at de i praksis behandler en organisations store datamængder.
Til behandling af meget komplekse data kan neurale netværk være særligt velegnede til finde informationer i billedfiler og store tekstfiler. Du får erfaring med Keras modulet og prøver kræfter med at lave dit eget neurale netværk med backpropagation som læringsprincip.
Endelig bliver vi nødt til at vurdere, om den beregningsmodel (estimator) vi har valgt, faktisk er anvendelig når datamængden vokser helt op på Big Data niveau - modellen skal valideres! Dette gennemgår vi også på kurset.
Kurset er meget matematisk orienteret og det anbefales derfor, at du får læst lidt op på emner som elementær statistik, sandsynlighedsregning og lineær algebra. Vi genopfrisker dog de vigtigste emner på kurset.
Certificeringspakker
Moduloversigt
- Modul 1Indledning
Machine learning overfor kunstig intelligens (AI), forskelle og ligheder
Hvad menes med Big Data ?
Python understøttelse af machine learning
- Modul 2Simpel data repræsentation og behandling
NumPy, det matematiske grundlag
Pandas og håndtering af datasæt fra flere kilder
Basal visualisering af covarians- og correlations-matricer, seaborn modulet
- Modul 3Datasæt forberedelse
Basale krav til datasættet m.h.p korrekthed og anvendelighed
Hvilke type data indeholder datasættet, kontinuerte overfor diskræte
Check for korrekte typer
Normalisering og Scalere
Opdeling i feature-matrix og target-vector
Opdeling i træning- og test subdataset
Forskellige former for indlæring, supervised vs unsupervised learning
- Modul 4Regressions-modeller
Regression, det matematiske grundlag
Oplæring af modellen med trænings-data
Predictions og fortolkning af resultatet
- Modul 5Klassifikations-modeller
Bayes teorem som matematisk grundlag
GaussianNB modellen og dens antagelser om datasættet
Andre varianter af NaiveBayes modellen
Confusion-matricer, visualisering af falske positive, falske negative
- Modul 6Avancerede lærings-modeller
Support vector machines
Decision-trees og RandomForest modeller
Kort om unsupervised learning
- Modul 7Kunstige neurale netværk i grundtræk
Kunstige neuroner overfor den virkelige hjerne
Den simple kunstige neuron
Opbygning af det neurale net - Keras og skjulte lag
Kompilering af aftestning af netværkets nøjagtighed
Håndtering af billeder (i grundtræk)
- Modul 8Validering af modeller
Hvad forstår man ved validering
KFold vallidation og learning-curves
Bias-varians trade-off problemet
Visualisering af bias-variance
Sænkning af bias - PolynomialFeatures
- Modul 9Håndtering af eksterne datakilder
Sikring af model-persistens, pickle og joblib
SQL databaser til opbevaring af datasæt
NoSQL databaser og optrænede modeller
Er du i tvivl?
Det ligger os meget på sinde, at du finder det kursusforløb, der skaber størst værdi for dig og din arbejdsplads. Tag fat i vores kursusrådgivere, de sidder klar til at hjælpe dig!