Opis predmeta
- Statistične posebnosti raziskav z visokorazsežnimi podatki. Načrtovanje raziskav z visokorazsežnimi podatki. Grafično prikazovanje podatkov.
- Identifikacija spremenljivk, ki so statistično značilno povezane z izidom (ponoven nastop bolezni, čas preživetja, itd). Večkratno testiranje: family-wise error rate, false discovery rate; parametrične in neparametrične reštive.
- Ocena multivariatne funkcije razvrščanja za napovedovanje izida. Metode za izbiro spremenljivk, za oceno funkcije razvrščanja in za oceno napovedne natančnosti.
- Interpretacija rezultatov.
Uporaba statističnega paketa R in Bioconductor.
Predmet učimo na programih
Cilji in kompetence
Raziskave z visokorazsežnimi podatki so zelo pogoste v praksi. Posebnost tovrstnih raziskav je v tem, da je spremenljivk tipično veliko več kot število vključenih statističnih enot. Zato je potrebno uporabljati statistične metode, ki pravilno obravnavajo probleme v zvezi z visokorazsežnimi podatki. Namen predmeta je usposobiti kandidata za samostojno izpeljavo raziskav na tem področju. Poudarek je na načrtovanju in na statistični analizi podatkov v visokorazsežvnih raziskav.
Metode poučevanja in učenja
Predavanja in vaje z računalnikom. Izdelava seminarske naloge (timsko delo) in predstavitev naloge pred letnikom. Opravljene domače naloge so pogoj za pristop h končnemu izpitu.
Del pedagoškega procesa bo izveden s pomočjo IKT tehnologij in možnosti, ki jih ponujajo.
Predvideni študijski rezultati
Znanje in razumevanje:
Študent zna načrtovati raziskavo z visokorazsežnimi podatki in zna izbrati in uporabljati primerno metodo za analizo podatkov. Študent zna interpretirati rezultate in pripraviti poročilo, ki vsebuje rezultate.
Temeljni viri in literatura
Sandrine Dudoit, Mark J. van der Laan. Multiple Testing Procedures with Applications to Genomics (2005). Springer Series in Statistics.
Richard M. Simon, Edward L. Korn, Lisa M. McShane, and Michael D. Radmacher et al. Design and Analysis of DNA Microarray Investigations (2004). Springer.
Richard O. Duda, Peter E. Hart, David G. Stork. Pattern Classification (2000). Wiley-Interscience.