Detaljer för kursplan för kurs FMSF90F giltig från och med VT 2023 Utskriftsvänlig visning Kurskod:FMSF90F Gäller från och med:Vårterminen 2023 Kursplanen är fastställd Allmänt Undervisningsspråk:Engelska Ges:Varje vårtermin Kurshemsida:http://www.ctr.maths.lu.se/utbildning/matematisk-statistik/ Syfte Kursen inleds med en överblick av grundläggande datahantering och visualisering, med fokus på att kunna identifiera och illustrera olika egenskaper och särdrag hos data. Därefter presenteras viktiga metoderna inom modern statistisk inlärning. Stor vikt läggs vid dimensionsreduktion, övervakade och oövervakade inlärning. Problemen med att anpassa flera olika modeller (multiple-testing) och metodernas relation till regression diskuteras. Datorbaserade laborationer och projekt utgör en viktig lärandeaktivitet. Kursen avslutas med ett projekt där studenterna ska välja lämpliga metoder för att analysera ett givet data material. Innehåll * Grundläggande datahantering och vanliga visualisering metoder för data. * Metoder för data reduktion som PrincipalKomponentAnalys (PCA) och deras användning för imputation av saknad data. * Metoder för oövervakad och övervakad inlärning/klassificering som: StödVektorMaskin (SVM), klustring (K-means), hierarkisk klustring, enklare regressionsmetoder samt metoder med beslutsträd (bagging, boosting och random forests). * Multiple-testning och lösningar som Benjamini-Hochberg och Bonferroni. Kunskap och förståelse För godkänd kurs skall doktoranden Beskriva olika sätt att aggregera, sammanfatta och visualisera data. Förklara principerna för dimensions reduktion Förklara principerna några olika typer övervakad och oövervakad inlärning. Färdighet och förmåga För godkänd kurs skall doktoranden kunna hantera, presentera och visualisera data för att belysa viktiga egenskaper och kännetecken i ett komplext datamaterial. kunna utföra dimensions reduktion och imputation av saknad data. kunna använda vanliga metoder för klassificering, övervakad inlärning och oövervakad inlärning kunna dra slutsatser om data baserat på resultaten från metoder för klassificering och inlärning. redovisa analys av och slutsatser från ett praktiskt problem i en skriftlig rapport. Värderingsförmåga och förhållningssätt För godkänd kurs skall doktoranden Reflektera över den valda modellens och metodens begränsningar samt möjliga alternativa lösningsmetoder. Reflektera över eventuella problem med att anpassa flera olika modeller till samma datamaterial. Undervisningsformer Föreläsningar Laborationer Projekt Examinationsformer Inlämningsuppgifter Kommentarer:Kursen examineras i fyra projekt. Tre som handlar om specifika delmoment och ett avslutande projekt som använder delar från hela kursen. Studenterna uppmuntras till att ta med egen data. Betygsskala:Underkänd, godkänd Förkunskapskrav Grundläggande statistik Förutsatta förkunskaper Grundläggande statistik, viss programmeringsvana Urvalskriterier Litteratur Litteratur:James, G., Witten, D., Hastie, T. & Tibshirani, R.: An Introduction to Statistical Learning: with Applications in R. Springer, 2021. ISBN 9781071614174. Övrig information Kurskod Kurskod:FMSF90F Administrativ information Datum för fastställande:2022-10-28 Beslutad av:Maria Sandsten Alla publicerade kurstillfällen för kursplanen Inga matchande kurstillfällen hittades. 0 kurstillfällen. Utskriftsvänlig visning