
Statistik og Dataanalyse med Python
Beskrivelse
Statistik er kernen i moderne dataanalyse – og Python er et af de mest populære værktøjer til at udføre den i praksis. På dette kursus får du en introduktion til de vigtigste statistiske begreber og lærer, hvordan du kan bruge Python-biblioteker som NumPy, Pandas, SciPy, Matplotlib og Seaborn til at gennemføre analyser.
Vi starter med Exploratory Data Analysis (EDA), hvor du lærer at forstå datastrukturer, udregne nøgletal som middelværdi, median, varians og standardafvigelse, samt at visualisere data med histograms, scatter plots og box plots. Herefter går vi i dybden med statistiske eksperimenter og signifikanstests – herunder hypotesetests, t-tests, p-værdier, konfidensintervaller og A/B-testing. Vi ser også på effektstørrelse, power-analyser og ANOVA til sammenligning af flere grupper.
Undervisningen er praksisnær, og du vil undervejs arbejde med konkrete dataeksempler i Python. Det giver dig både forståelse for teorien og evnen til at anvende den direkte i dit daglige arbejde med data.
Efter kurset kan du:
- Udforske og opsummere datasæt med deskriptiv statistik
- Visualisere data og mønstre med Python
- Udføre hypotesetests og fortolke p-værdier og konfidensintervaller
- Beregne og forstå statistisk power og stikprøvestørrelse
- Anvende A/B-tests og ANOVA til sammenligning af grupper
- Arbejde sikkert med Python-biblioteker til dataanalyse
Moduloversigt
- Modul 1Exploratory Data Analysis (EDA)
- Hvad er statistik, og hvornår bruger vi det?
- Datastrukturer: structured vs. unstructured data, rectangular data
- Python og biblioteker til dataanalyse (NumPy, Pandas, SciPy, Matplotlib, Seaborn)
- Summary statistics: mean, median, variance, standard deviation
- Quantiles og percentiles
- Covariance og correlation – forstå sammenhænge mellem variable
- Visualisering: histogrammer, scatter plots, line plots, box plots
- Modul 2Statistical Experiments and Significance Testing
- The Central Limit Theorem og normalfordeling
- Statistiske funktioner og fordelinger i Python (Normal, t, Chi-Square, m.fl.)
- Hypothesis testing og p-værdier
- T-tests (én- og to-sample)
- Konfidensintervaller og kritiske værdier
- Statistisk power, Type I og II fejl, og stikprøvestørrelse
- A/B-testing – design, udførsel og tolkning
- ANOVA (one-way og two-way) inkl. post-hoc analyser
Er du i tvivl?
Det ligger os meget på sinde, at du finder det kursusforløb, der skaber størst værdi for dig og din arbejdsplads. Tag fat i vores kursusrådgivere, de sidder klar til at hjælpe dig!
