Opis predmeta
Predmet ponuja celovit vpogled v področje govornih in slikovnih tehnologij, s posebnim poudarkom na sistemih za razpoznavanje vzorcev. Uvod v predmet obravnava zgodovino in osnovne značilnosti področja, vključno z osnovami slušnega zaznavanja in govornih komunikacij pri ljudeh ter metod predstavitve in kodiranja informacij z govorom. V nadaljevanju se osredotoča na obdelavo govora, kjer obravnava zajem, predobdelavo, in značilke govornega signala ter postopke za razčlenjevanje govora in uporabo govornih podatkovnih zbirk. Predstavljene so različne vrste sistemov za razpoznavanje govora, statistično modeliranje akustične in jezikovne predstavitve ter pomenska analiza govora.
Posebna pozornost je namenjena umetnemu govoru, kjer predmet študente seznani z zgradbo sistemov za tvorjenje, grafemsko-fonemsko pretvorbo, modeliranjem prozodije in metodami tvorjenja umetnega govornega signala. Predmet prav tako obravnava sisteme za vodenje dialoga, načine vodenja in vrednotenje njihovega delovanja. V kontekstu slikovnih tehnologij predmet najprej predstavi osnovne pojme, uporabo slikovnih tehnologij, transformacije slikovnih podatkov, barvne prostore, kodiranje slik in obdelavo slikovnih podatkov v slikovnem ter frekvenčnem prostoru, vključno z modeli šuma, obnavljanjem, morfološkimi operacijami in iskanjem robov. Nadalje so predstavljeni napredni algoritmi za krajevne deskriptorje, detekcijo in razpoznavanje objektov ter pod-prostori za predstavitev podatkov. Predmet prav tako obravnava postopke segmentacije slik, ki temeljijo na rojenju ter drugih pristopih kot je premik-povprečja.
Predmet učimo na programih
Multimedija 1. stopnja
Cilji in kompetence
Seznanjanje s področjem govornih in slikovnih tehnologij, spoznavanje samodejnih postopkov za izvajanje različnih nalog s tega področja.
Metode poučevanja in učenja
Predavanja
Sodelovalno učenje
Laboratorijske vaje
Predvideni študijski rezultati
Po uspešno opravljenem predmetu naj bi bili študenti zmožni:
- opredeliti osnove načine za opis, predstavitev, tvorjenje ter razpoznavanje govornih in slikovnih signalov,
- opisati osnovne značilnosti, gradnike, načine delovanja in zmogljivosti sistemov govornih in slikovnih tehnologij,
- uporabiti izbrane programske rešitve za razvoj govorne komunikacije med človekom in strojem ter aplikacij za obdelavo in razpoznavanje slik,
- razlikovati med različnimi nalogami govornih in slikovnih tehnologij ter metodami predstavitve in obdelave, ki se pri tem uporabljajo,
- združiti osnovne postopke predstavitve in obdelave govornih in slikovnih signalov v kompleksnejše sisteme za razpoznavanje in sintezo govora in slik,
ovrednotiti točnost in zanesljivost delovanja sistemov govornih in slikovnih tehnologij.
Temeljni viri in literatura
-
Mihelič F., Signali, Založba FE in FRI, Ljubljana, 2006.
-
Pavešić N., Razpoznavanje vzorcev: uvod v analizo in razumevanje vidnih in slušnih vzorcev, Popravljena in dopolnjena izdaja, Založba FE in FRI, Ljubljana, 2012.
-
Rabiner L., Schafer R., Theory and Applications of Digital Speech Processing, Prentince Hall, 1. Ed., 2010.
-
Gonzales R. C., Woods, R.E., Digital Image Processing, 3 izdaja, Prentice Hall, 2007.
-
R.C. Gonzales, R.E. Woods, S.L. Eddins, Digital image processing using Matlab, 2 izdaja. Gatesmark Publishing, 2009.