Opis predmeta
Uvod: opis področja, kratek zgodovinski oris razvoja govornih tehnologij, pomen raziskav in pridobivanja znanj na tem področju za slovenski jezik.
Osnovne karakteristike produkcije in zaznavanja govora pri govorni komunikaciji med ljudmi. Predstavitve govornih signalov.
Računalniška obdelava govornega signala: predobdelava, značilke govornega signala, razčlenjevanje govornega signala, govorne podatkovne zbirke.
Sistemi za razpoznavanje govora: verifikacija in identifikacija govorca, razpoznavanje ločeno in vezano izgovorjenih besed ter spontanega govora. Statistično modeliranje akustične in jezikovne predstavitve govora ter njegova pomenska analiza.
Umetni govor: zgradba sistemov za umetni govora, grafemsko fonemska pretvorba, modeliranje prozodije, načini tvorjenja umetnega govornega signala. Vrednotenje sistemov za sintezo govora.
Sistemi, ki omogočajo dialog z računalnikom: zgradba sistemov, upravljanje dialoga, predstavitev znanja, večmodalnost v sistemih za dialog, vrednotenje sistemov za dialog.
Cilji in kompetence
Seznanjanje s področjem govornih tehnologij, spoznavanje samodejnih postopkov za izvajanje različnih nalog s tega področja.
Metode poučevanja in učenja
- Predavanja,
- Sodelovalno učenje,
- laboratorijske vaje,
- Seminarska naloga
Predvideni študijski rezultati
Po uspešno opravljenem predmetu naj bi bili študenti zmožni:
- opredeliti osnove načine za opis, predstavitev, tvorjenje ter razpoznavanje govornih signalov,
- opisati osnovne značilnosti, gradnike, načine delovanja in zmogljivosti sistemov govornih tehnologij,
- uporabiti izbrane programske rešitve za razvoj govorne komunikacije med človekom in strojem,
- razlikovati med različnimi nalogami govornih tehnologij ter metodami predstavitve in obdelave, ki se pri tem uporabljajo,
- združiti osnovne postopke predstavitve in obdelave govornih signalov v kompleksnejše sisteme za razpoznavanje in sintezo govora,
- ovrednotiti točnost in zanesljivost delovanja sistemov govornih tehnologij.
Reference nosilca
- GAJŠEK, Rok, MIHELIČ, France, DOBRIŠEK, Simon. Speaker state recognition using an HMM-based feature extraction method. Computer speech & language, ISSN 0885-2308, Jan. 2013, vol. 27, no. 1, str. 135-150.
- VESNICER, Boštjan, ŽGANEC GROS, Jerneja, MIHELIČ, France. Fusion of discriminative and generative scoring criteria in GMM-based speaker verification. V: HABERNAL, Ivan (ur.), MATOUŠEK, Václav (ur.). Text, speech and dialogue : proceedings, (Lecture notes in computer science, ISSN 0302-9743, Lecture notes in artifical intelligence, 6836). Berlin; Heidelberg: Springer, cop. 2011, str. 139-146.
- PAVEŠIĆ, Nikola, ŽGANEC GROS, Jerneja, DOBRIŠEK, Simon, MIHELIČ, France. Homer II – man – machine interface to internet for blind and visually impaired people. Computer communications, ISSN 0140-3664. [Print ed.], 2003, vol. 26, str. 438-44
- DOBRIŠEK, Simon, ŽIBERT, Janez, PAVEŠIĆ, Nikola, MIHELIČ, France. An edit-distance model for the approximate matching of timed strings. IEEE transactions on pattern analysis and machine intelligence, ISSN 0162-8828. [Print ed.], Apr. 2009, vol. 31, no. 4, str. 736-741.
- MIHELIČ, France. Samodejna obdelava slovenskega govora. Inženir, ISSN 1855-0290, 2010, vol. 3, št. 2, str. 54-61.
Temeljni viri in literatura
- Mihelič F., Signali, Založba FE in FRI, Ljubljana, 2014
- Pavešić N., Razpoznavanje vzorcev: uvod v analizo in razumevanje vidnih in slušnih vzorcev, 3. Popravljena in dopolnjena izdaja, Založba FE in FRI, Ljubljana, 2012
- Rabiner L., Schafer R., Theory and Applications of Digital Speech Processing, Prentince Hall, 1. Ed., 2010