Statistične metode za visokorazsežne podatke

Opis predmeta

  1. Statistične posebnosti raziskav z visokorazsežnimi podatki.  Načrtovanje raziskav z visokorazsežnimi podatki. Grafično prikazovanje podatkov.
  2. Identifikacija spremenljivk, ki so statistično značilno povezane z izidom (ponoven nastop bolezni, čas preživetja, itd). Večkratno testiranje: family-wise error rate, false discovery rate; parametrične in neparametrične reštive.
  3. Ocena multivariatne funkcije razvrščanja za napovedovanje izida.  Metode za izbiro spremenljivk, za oceno funkcije razvrščanja in za oceno napovedne natančnosti.
  4. Interpretacija rezultatov.

Uporaba statističnega paketa R in Bioconductor.

Predmet učimo na programih

Cilji in kompetence

Raziskave z visokorazsežnimi podatki  so zelo pogoste v praksi. Posebnost tovrstnih raziskav  je v tem, da je spremenljivk tipično veliko več kot število vključenih statističnih enot. Zato je potrebno uporabljati statistične metode, ki pravilno obravnavajo probleme v zvezi z visokorazsežnimi podatki. Namen predmeta je usposobiti kandidata za samostojno izpeljavo raziskav na tem področju. Poudarek je na načrtovanju in na statistični analizi podatkov v visokorazsežvnih raziskav.

Metode poučevanja in učenja

Predavanja in vaje z računalnikom. Izdelava seminarske naloge (timsko delo) in predstavitev naloge pred letnikom. Opravljene domače naloge so pogoj za pristop h končnemu izpitu.

Del pedagoškega procesa bo izveden s pomočjo IKT tehnologij in možnosti, ki jih ponujajo.

Predvideni študijski rezultati

Znanje in razumevanje:

Študent zna načrtovati raziskavo z visokorazsežnimi podatki in zna izbrati in uporabljati primerno metodo za analizo podatkov. Študent zna interpretirati rezultate in pripraviti poročilo, ki vsebuje rezultate.

Temeljni viri in literatura

Sandrine Dudoit, Mark J. van der Laan.  Multiple Testing Procedures with Applications to Genomics (2005).  Springer Series in Statistics.

Richard M. Simon, Edward L. Korn, Lisa M. McShane, and Michael D. Radmacher et al.  Design and Analysis of DNA Microarray Investigations (2004). Springer.

Richard O. Duda, Peter E. Hart, David G. Stork. Pattern Classification (2000). Wiley-Interscience.

Bodi na tekočem

Univerza v Ljubljani, Fakulteta za elektrotehniko, Tržaška cesta 25, 1000 Ljubljana

E:  dekanat@fe.uni-lj.si T:  01 4768 411