Kursplan för

Dataanalys: statistisk inlärning och visualisering med projekt
Data Analysis: Statistical Learning and Visualization with Project

FMSF90F, 7.5 högskolepoäng

Gäller från och med: Vårterminen 2023
Beslutad av: Maria Sandsten
Datum för fastställande: 2022-10-28

Allmänna uppgifter

Avdelning: Matematisk statistik (LTH)
Kurstyp: Gemensam kurs, avancerad nivå och forskarnivå
Kursen ges även på avancerad nivå med kurskod: FMSF90
Undervisningsspråk: Engelska

Syfte

Kursen inleds med en överblick av grundläggande datahantering och visualisering, med fokus på att kunna identifiera och illustrera olika egenskaper och särdrag hos data. Därefter presenteras viktiga metoderna inom modern statistisk inlärning. Stor vikt läggs vid dimensionsreduktion, övervakade och oövervakade inlärning. Problemen med att anpassa flera olika modeller (multiple-testing) och metodernas relation till regression diskuteras. Datorbaserade laborationer och projekt utgör en viktig lärandeaktivitet. Kursen avslutas med ett projekt där studenterna ska välja lämpliga metoder för att analysera ett givet data material.

Mål

Kunskap och förståelse

För godkänd kurs skall doktoranden

Färdighet och förmåga

För godkänd kurs skall doktoranden

Värderingsförmåga och förhållningssätt

För godkänd kurs skall doktoranden

Kursinnehåll

* Grundläggande datahantering och vanliga visualisering metoder för data. * Metoder för data reduktion som PrincipalKomponentAnalys (PCA) och deras användning för imputation av saknad data. * Metoder för oövervakad och övervakad inlärning/klassificering som: StödVektorMaskin (SVM), klustring (K-means), hierarkisk klustring, enklare regressionsmetoder samt metoder med beslutsträd (bagging, boosting och random forests). * Multiple-testning och lösningar som Benjamini-Hochberg och Bonferroni.

Kurslitteratur

James, G., Witten, D., Hastie, T. & Tibshirani, R.: An Introduction to Statistical Learning: with Applications in R. Springer, 2021. ISBN 9781071614174.

Kursens undervisningsformer

Undervisningsformer: Föreläsningar, laborationer, projekt

Kursens examination

Examinationsform: Inlämningsuppgifter. Kursen examineras i fyra projekt. Tre som handlar om specifika delmoment och ett avslutande projekt som använder delar från hela kursen. Studenterna uppmuntras till att ta med egen data.
Betygsskala: Underkänd, godkänd
Examinator:

Antagningsuppgifter

Förkunskapskrav: Grundläggande statistik
Förutsatta förkunskaper: Grundläggande statistik, viss programmeringsvana

Kurstillfällesinformation

Kontaktinformation och övrigt

Kursansvariga:
Hemsida: http://www.ctr.maths.lu.se/utbildning/matematisk-statistik/


Fullständig visning