Inteligentni sistemi v avtomatiki

Opis predmeta

  • Uvod v razpoznavanje vzorcev in umetno inteligenco: osnovni pojmi in izrazoslovje.
  • Metode obdelave in razpoznavanja vidnih vzorcev: zajem vidnih vzorcev, razčlenjevanje slik na enovita področja, značilke oblike in sestave površine področij, samodejno učenje in razpoznavanje predmetov.
  • Samodejno vidno zaznavanje in razpoznavanje oseb v nadzorovanih prostorih. Metode vidnega zaznavanja in razpoznavanja obrazov in postav ljudi na slikah.
  • Metode obdelave in razpoznavanja slušnih vzorcev: zajem slušnih vzorcev, razčlenjevanje govornega signala, računanje energije in koeficientov kepstra izsekov signala, opis dinamike signala, samodejno učenje in razpoznavanje ločeno izgovorjenih ukazov .
  • Tvorjenje umetnega govora: akustično modeliranje govora, osnovne metode tvorjenja umetnega govornega signala, samodejno učenje sintetizatorja govora iz posnetkov naravnega govora.
  • Govorna komunikacija človek – stroj: gradniki sistemov za govorno komunikacijo med človekom in strojem, razpoznavalnik govora, sintetizator govora, sistem za vodenje dialoga.

Cilji in kompetence

Cilj predmeta je študentu podati znanje o osnovnih konceptih in gradnikih  inteligentnih sistemov v avtomatiki. Poseben poudarek je na seznanjanju z osnovami strojnega vida, osnovami samodejnega razpoznavanja in sinteze govora ter s sodobnimi načini komunikacije človek-stroj. Študent se seznani z zasnovami inteligentnih sistemov ter s primeri izvedb takšnih sistemov. Pridobljeno znanje podaja vpogled v možnosti in omejitve pri uporabi sistemov za samodejno razpoznavanje slikovnih in govornih vzorcev za razvoj inteligentnih sistemov v avtomatiki.

Metode poučevanja in učenja

Na predavanjih so podane teoretične osnove vseh obravnavanih modelov in metod. Predstavljeni so tudi primeri inteligentnih sistemov v avtomatiki ter računski primeri, ki ponazarjajo bistvene značilnosti predstavljenih metod. Študentom je na razpolago učbenik in drugo gradivo v obliki skripte z rešenimi nalogami in drsnice s predavanj. V okviru predavanja študenti dobijo neobvezne domače naloge, ki vključujejo nekaj teoretičnih vprašanj in nekaj računskih nalog, katerih namen je sprotno preverjanje pridobljenega znanja. Praktično delo poteka v okviru laboratorijskih vaj, kjer študenti rešujejo predvsem zadane programerske naloge.

Predvideni študijski rezultati

Po uspešno opravljenem predmetu naj bi bili študenti zmožni:

  • opisati osnovne metode samodejnega razpoznavanja vidnih in slušnih vzorcev,
  • predstaviti primere inteligentnih sistemov, ki vključujejo metode razpoznavanja vidnih in slušnih vzorcev,
  • uporabiti uporabniške programske vmesnike za razvoj govorne komunikacije med človekom in strojem,
  • uporabiti odprtokodna razvojna orodja OpenCV in WEKA, programske jezike C++ in Java, prevajalnik GCC in okolje za programiranje Netbeans za razvoj osnovnih primerov inteligentnih sistemov,
  • zasnovati osnovne primere inteligentnih sistemov, ki vključujejo metode razpoznavanja vidnih in slušnih vzorcev ter
  • ovrednotiti uporabno vrednost danih inteligentnih sistemov, ki vključujejo metode razpoznavanja vidnih in slušnih vzorcev.

Reference nosilca

  1. KRAVANJA, Jaka, ŽGANEC, Mario, ŽGANEC GROS, Jerneja, DOBRIŠEK, Simon, ŠTRUC, Vitomir. Exploiting spatio-temporal information for light-plane labeling in depth-image sensors using probabilistic graphical models. Informatica, ISSN 0868-4952, 2016, vol. 27, no. 1, str. 67-84.
  2. GAJŠEK, Rok, MIHELIČ, France, DOBRIŠEK, Simon. Speaker state recognition using an HMM-based feature extraction method. Computer speech & language, ISSN 0885-2308, Jan. 2013, vol. 27, no. 1, str. 135-150.
  3. DOBRIŠEK, Simon, ŠTRUC, Vitomir, MIHELIČ, France, VESNICER, Boštjan. Bodo pametni nadzorni sistemi prisluhnili, razumeli in spregovorili slovensko?. V: ERJAVEC, Tomaž (ur.), ŽGANEC GROS, Jerneja (ur.). Jezikovne tehnologije, (Slovenščina 2.0, ISSN 2335-2736, Tematska številka, Letn. 1, št. 2). Ljubljana: Trojina, zavod za uporabno slovenistiko, 2013, letn. 1, št. 2, str. 165-180.
  4. MIHELIČ, France (intervjuvanec), DOBRIŠEK, Simon (intervjuvanec), JUSTIN, Tadej (intervjuvanec). Vabljeni na pogovor s stroji! : Frekvenca X. Ljubljana: Val 202, 3. 10. 2013
  5. DOBRIŠEK, Simon, MIHELIČ, France. Time- and acoustic-mediated alignment algorithms for speech recognition evaluation. V: 12th Annual Conference of the International Speech Communication Association, August 27-31, 2011, Florence, Italy. COSI, Piero (ur.). Speech science and technology for real life : conference proceedings, (Interspeech, ISSN 1990-9772). [Grenoble]: International Speech Communication Association, cop. 2011, str. 1517-1520.

Temeljni viri in literatura

  • N. Pavešić: Razpoznavanje vzorcev : uvod v analizo in razumevanje vidnih in slušnih signalov,  3., popravljena in dopolnjena izdaja,  Založba FE in FRI, 2012. 2 zv.  ([XVI], 707 str.), ilustr.  ISBN 978-961-243-201-0. [COBISS.SI-ID 260256256]
  • R. C. Gonzalez, R. E. Woods, S. L. Eddins: Digital Image Processing Using MATLAB , 2. izdaja, Gatesmark Publishing, 2009.
  • J. C. Russ: The Image Processing Handbook, 6. izdaja, CRC, 2011.
  • R. Pieraccini: The Voice in the Machine: Building Computers That Understand Speech, MIT Press , 2012.
  • P. Taylor: Text-to-Speech Synthesis, Cambridge University Press, 2009.

Bodi na tekočem

Univerza v Ljubljani, Fakulteta za elektrotehniko, Tržaška cesta 25, 1000 Ljubljana

E:  dekanat@fe.uni-lj.si T:  01 4768 411