Opis predmeta
- Uvod v razpoznavanje vzorcev in umetno inteligenco: osnovni pojmi in izrazoslovje.
- Metode obdelave in razpoznavanja vidnih vzorcev: zajem vidnih vzorcev, razčlenjevanje slik na enovita področja, značilke oblike in sestave površine področij, samodejno učenje in razpoznavanje predmetov.
- Samodejno vidno zaznavanje in razpoznavanje oseb v nadzorovanih prostorih. Metode vidnega zaznavanja in razpoznavanja obrazov in postav ljudi na slikah.
- Metode obdelave in razpoznavanja slušnih vzorcev: zajem slušnih vzorcev, razčlenjevanje govornega signala, računanje energije in koeficientov kepstra izsekov signala, opis dinamike signala, samodejno učenje in razpoznavanje ločeno izgovorjenih ukazov .
- Tvorjenje umetnega govora: akustično modeliranje govora, osnovne metode tvorjenja umetnega govornega signala, samodejno učenje sintetizatorja govora iz posnetkov naravnega govora.
- Govorna komunikacija človek – stroj: gradniki sistemov za govorno komunikacijo med človekom in strojem, razpoznavalnik govora, sintetizator govora, sistem za vodenje dialoga.
Cilji in kompetence
Cilj predmeta je študentu podati znanje o osnovnih konceptih in gradnikih inteligentnih sistemov v avtomatiki. Poseben poudarek je na seznanjanju z osnovami strojnega vida, osnovami samodejnega razpoznavanja in sinteze govora ter s sodobnimi načini komunikacije človek-stroj. Študent se seznani z zasnovami inteligentnih sistemov ter s primeri izvedb takšnih sistemov. Pridobljeno znanje podaja vpogled v možnosti in omejitve pri uporabi sistemov za samodejno razpoznavanje slikovnih in govornih vzorcev za razvoj inteligentnih sistemov v avtomatiki.
Metode poučevanja in učenja
Na predavanjih so podane teoretične osnove vseh obravnavanih modelov in metod. Predstavljeni so tudi primeri inteligentnih sistemov v avtomatiki ter računski primeri, ki ponazarjajo bistvene značilnosti predstavljenih metod. Študentom je na razpolago učbenik in drugo gradivo v obliki skripte z rešenimi nalogami in drsnice s predavanj. V okviru predavanja študenti dobijo neobvezne domače naloge, ki vključujejo nekaj teoretičnih vprašanj in nekaj računskih nalog, katerih namen je sprotno preverjanje pridobljenega znanja. Praktično delo poteka v okviru laboratorijskih vaj, kjer študenti rešujejo predvsem zadane programerske naloge.
Predvideni študijski rezultati
Po uspešno opravljenem predmetu naj bi bili študenti zmožni:
- opisati osnovne metode samodejnega razpoznavanja vidnih in slušnih vzorcev,
- predstaviti primere inteligentnih sistemov, ki vključujejo metode razpoznavanja vidnih in slušnih vzorcev,
- uporabiti uporabniške programske vmesnike za razvoj govorne komunikacije med človekom in strojem,
- uporabiti odprtokodna razvojna orodja OpenCV in WEKA, programske jezike C++ in Java, prevajalnik GCC in okolje za programiranje Netbeans za razvoj osnovnih primerov inteligentnih sistemov,
- zasnovati osnovne primere inteligentnih sistemov, ki vključujejo metode razpoznavanja vidnih in slušnih vzorcev ter
- ovrednotiti uporabno vrednost danih inteligentnih sistemov, ki vključujejo metode razpoznavanja vidnih in slušnih vzorcev.
Reference nosilca
- KRAVANJA, Jaka, ŽGANEC, Mario, ŽGANEC GROS, Jerneja, DOBRIŠEK, Simon, ŠTRUC, Vitomir. Exploiting spatio-temporal information for light-plane labeling in depth-image sensors using probabilistic graphical models. Informatica, ISSN 0868-4952, 2016, vol. 27, no. 1, str. 67-84.
- GAJŠEK, Rok, MIHELIČ, France, DOBRIŠEK, Simon. Speaker state recognition using an HMM-based feature extraction method. Computer speech & language, ISSN 0885-2308, Jan. 2013, vol. 27, no. 1, str. 135-150.
- DOBRIŠEK, Simon, ŠTRUC, Vitomir, MIHELIČ, France, VESNICER, Boštjan. Bodo pametni nadzorni sistemi prisluhnili, razumeli in spregovorili slovensko?. V: ERJAVEC, Tomaž (ur.), ŽGANEC GROS, Jerneja (ur.). Jezikovne tehnologije, (Slovenščina 2.0, ISSN 2335-2736, Tematska številka, Letn. 1, št. 2). Ljubljana: Trojina, zavod za uporabno slovenistiko, 2013, letn. 1, št. 2, str. 165-180.
- MIHELIČ, France (intervjuvanec), DOBRIŠEK, Simon (intervjuvanec), JUSTIN, Tadej (intervjuvanec). Vabljeni na pogovor s stroji! : Frekvenca X. Ljubljana: Val 202, 3. 10. 2013
- DOBRIŠEK, Simon, MIHELIČ, France. Time- and acoustic-mediated alignment algorithms for speech recognition evaluation. V: 12th Annual Conference of the International Speech Communication Association, August 27-31, 2011, Florence, Italy. COSI, Piero (ur.). Speech science and technology for real life : conference proceedings, (Interspeech, ISSN 1990-9772). [Grenoble]: International Speech Communication Association, cop. 2011, str. 1517-1520.
Temeljni viri in literatura
- N. Pavešić: Razpoznavanje vzorcev : uvod v analizo in razumevanje vidnih in slušnih signalov, 3., popravljena in dopolnjena izdaja, Založba FE in FRI, 2012. 2 zv. ([XVI], 707 str.), ilustr. ISBN 978-961-243-201-0. [COBISS.SI-ID 260256256]
- R. C. Gonzalez, R. E. Woods, S. L. Eddins: Digital Image Processing Using MATLAB , 2. izdaja, Gatesmark Publishing, 2009.
- J. C. Russ: The Image Processing Handbook, 6. izdaja, CRC, 2011.
- R. Pieraccini: The Voice in the Machine: Building Computers That Understand Speech, MIT Press , 2012.
- P. Taylor: Text-to-Speech Synthesis, Cambridge University Press, 2009.