Opis predmeta
Pri predmetu bodo predstavljena in obdelana izbrana poglavja z naslednjih področij:
– predobdelava podatkov, odkrivanju osamelcev, konstruktivna indukcija, diskretizacija,
– izbor množice informativnih atributov,
– raziskovalna analiza podatkov, vizualizacija, tehnike inteligentne vizualizacije,
– napovedno modeliranje (uvrščanje in regresija) s poudarkom na izbranih osnovnih in modernih pristopih (Bayesovsko modeliranje, metoda podpornih vektorjev, učenje s pravili),
– osnovni pristopi v razvrščanju,
– tehnike vrednotenja postopkov modeliranja, cenilke napovedne točnosti,
– uporaba odkrivanja znanj iz podatkov na industrijskih, znanstvenih in poslovnih problemih, osnove uporabe teh tehnik na področju obdelave spletnih in tekstovnih podatkov,
– orodja za odkrivanje znanj iz podatkov, s poudarkom na skriptnih orodjih in okoljih z vizualnim programiranjem.
Cilji in kompetence
Študent se bo seznanil z izbranimi osnovnimi in naprednimi koncepti s področja odkrivanja znanj iz podatkov in se naučil, kako teoretične pristope in metode uporabiti pri reševanju kompleksnih realnih problemov. Za dani problem bo znal uporabiti pravi nabor tehnik za predobdelavo podatkov, vizualizacijo in raziskovalno analizo podatkov, izbrati pravo tehniko podatkovnega modeliranja in predstaviti zgrajeni model v obliki, ki bo lahko razumljiva in uporabna domenskemu ekspertu. Na laboratorijskih vajah se bo seznanil s programskimi orodji za odkrivanje znanj iz podatkov, znal bo te uporabiti v konkretnih problemskih situacijah.
Metode poučevanja in učenja
Predavanja s podporo avdio-vizualne opreme, aktivna uporaba sistema za upravljanje s študijskimi vsebinami (npr. Moodle). Laboratorijske vaje v računalniški učilnici z ustrezno strojno in programsko opremo. Kombiniranje delo posamezno in v skupinah, ter individualnega dela ter interakcij pri seminarjih in na konzultacijskih urah.
Predvideni študijski rezultati
Znanje in razumevanje: Poznavanje metod odkrivanja znanje iz podatkov, zmožnost njihove rabe in ovrednotenja njihovih rezultatov.
Uporaba: Uporaba pri rudarjenju resničnih podatkov.
Refleksija: Spoznavanje in razumevanje uglašenosti med teorijo in njeno aplikacijo na konkretnih primerih s področja modeliranja podatkov.
Reference nosilca
Blaž Zupan:
1. Bellazzi R, Zupan B (2008) Predictive data mining in clinical medicine: Current issues and guidelines. Int J Med Inform 77(2):81-97.
2. Zupan B, Demšar J (2007) Open-source tools for data mining. Clinical Laboratory Medicine, 8(1): 37-54.
3. Demšar J, Leban G, Zupan B. FreeViz-An intelligent multivariate visualization approach to explorative analysis of biomedical data (2007) J Biomed Inform 40(6):661-71.
Temeljni viri in literatura
Tan P-N, Steinbach M, Kumar V: Introduction to data mining, Pearson Addison Wesley, 2005.
Dodatna: Hastie T, Tibshirani R, Friedman J: The elements of statistical learning: data mining, inference and prediction, Springer, 2001.