lu.se

Forskar­utbildnings­kurser

Lunds tekniska högskola | Lunds universitet

Detaljer för kursplan för kurs FMSF90F giltig från och med VT 2023

Utskriftsvänlig visning

Allmänt
Syfte
  • Kursen inleds med en överblick av grundläggande datahantering och visualisering, med fokus på att kunna identifiera och illustrera olika egenskaper och särdrag hos data.

    Därefter presenteras viktiga metoderna inom modern statistisk inlärning. Stor vikt läggs vid dimensionsreduktion, övervakade och oövervakade inlärning. Problemen med att anpassa flera olika modeller (multiple-testing) och metodernas relation till regression diskuteras. Datorbaserade laborationer och projekt utgör en viktig lärandeaktivitet. Kursen avslutas med ett projekt där studenterna ska välja lämpliga metoder för att analysera ett givet data material.
Innehåll
  • * Grundläggande datahantering och vanliga visualisering metoder för data.
    * Metoder för data reduktion som PrincipalKomponentAnalys (PCA) och deras användning för imputation av saknad data.
    * Metoder för oövervakad och övervakad inlärning/klassificering som: StödVektorMaskin (SVM), klustring (K-means), hierarkisk klustring, enklare regressionsmetoder samt metoder med beslutsträd (bagging, boosting och random forests).
    * Multiple-testning och lösningar som Benjamini-Hochberg och Bonferroni.
Kunskap och förståelse
  • För godkänd kurs skall doktoranden
  • Beskriva olika sätt att aggregera, sammanfatta och visualisera data.
    Förklara principerna för dimensions reduktion
    Förklara principerna några olika typer övervakad och oövervakad inlärning.
Färdighet och förmåga
  • För godkänd kurs skall doktoranden
  • kunna hantera, presentera och visualisera data för att belysa viktiga egenskaper och kännetecken i ett komplext datamaterial.
    kunna utföra dimensions reduktion och imputation av saknad data.
    kunna använda vanliga metoder för klassificering, övervakad inlärning och oövervakad inlärning
    kunna dra slutsatser om data baserat på resultaten från metoder för klassificering och inlärning.
    redovisa analys av och slutsatser från ett praktiskt problem i en skriftlig rapport.
Värderingsförmåga och förhållningssätt
  • För godkänd kurs skall doktoranden
  • Reflektera över den valda modellens och metodens begränsningar samt möjliga alternativa lösningsmetoder.
    Reflektera över eventuella problem med att anpassa flera olika modeller till samma datamaterial.
Undervisningsformer
  • Föreläsningar
  • Laborationer
  • Projekt
Examinationsformer
  • Inlämningsuppgifter
  • Kursen examineras i fyra projekt. Tre som handlar om specifika delmoment och ett avslutande projekt som använder delar från hela kursen. Studenterna uppmuntras till att ta med egen data.
  • Underkänd, godkänd
Förkunskapskrav
  • Grundläggande statistik
Förutsatta förkunskaper
  • Grundläggande statistik, viss programmeringsvana
Urvalskriterier
Litteratur
  • James, G., Witten, D., Hastie, T. & Tibshirani, R.: An Introduction to Statistical Learning: with Applications in R. Springer, 2021. ISBN 9781071614174.
Övrig information
Kurskod
  • FMSF90F
Administrativ information
  • 2022-10-28
  • Maria Sandsten

Alla publicerade kurstillfällen för kursplanen

Inga matchande kurstillfällen hittades.

0 kurstillfällen.


Utskriftsvänlig visning