Modul I: Inteligentni avdio in govorni sistemi

Opis predmeta

V okviru predmeta se študenti seznanijo z razvojem in uporabo inteligentnih avdio in govornih sistemov. Obravnavane so osnovne značilnosti človekovega slušnega zaznavanja ter temeljne metode za analizo in sintezo govornih in drugih zvočnih signalov.  

V okviru predmeta se obravnava metode predobdelave in analize značilnosti zajetih zvočnih signalov, ki omogočajo razpoznavanje značilnih zvokov, kot so različni okoljski zvoki ter živalski in prometni zvoki. Pozornost je posvečena tudi možnosti zvočnega preverjanja delovanja strojev in naprav in diagnosticiranja njihovih okvar.

Poseben poudarek je na sistemih za razpoznavanje govora in govorcev ter na statističnem modeliranju govorjenih jezikov. Obravnavani so tudi sistemi za tvorjenje umetnega govora ter sistemi za komunikacijo človek-stroj, pri čemer se obravnava sisteme za upravljanje dialoga, modele za predstavitev znanja, tovrstnih sistemov in tudi več-modalnost v komunikaciji. 

Predmet učimo na programih

Elektrotehnika 2. stopnja

Cilji in kompetence

Cilj predmeta je seznanjanje študentov s področjem strojnega sluha in govornih tehnologij, predstavitev različnih algoritmov, tehnik in metod za doseganje različnih nalog s področja predmeta. 

Metode poučevanja in učenja

Predavanja, sodelovalno učenje, laboratorijske vaje, seminarska naloga.

Predvideni študijski rezultati

Po uspešno opravljenem predmetu naj bi bili študenti zmožni: 

  • opredeliti osnove načine za opis, predstavitev, tvorjenje ter razpoznavanje različnih zvočnih in govornih signalov, 
  • opisati osnovne značilnosti, gradnike, načine delovanja in zmogljivosti sistemov strojnega sluha in govornih tehnologij, 
  • uporabiti izbrane programske rešitve za razvoj sistemov strojnega sluha ter sistemov za govorno komunikacijo med človekom in strojem, 
  • razlikovati med različnimi nalogami strojnega sluha in govornih tehnologij ter  metodami predstavitve in obdelave, ki se pri tem uporabljajo, 
  • združiti osnovne postopke predstavitve in obdelave zvočnih signalov v kompleksnejše sisteme za razpoznavanje različnih zvokov ter za razpoznavanje in sintezo govora, 
  • ovrednotiti točnost in zanesljivost delovanja sistemov strojnega sluha in govornih tehnologij. 

Temeljni viri in literatura

  1. N. Pavešić: Razpoznavanje vzorcev : uvod v analizo in razumevanje vidnih in slušnih signalov,  3. popravljena in dopolnjena izdaja,  Založba FE in FRI, 2012 . ISBN 978-961-243-201-0. [COBISS.SI-ID 260256256] 

  2. I. McLoughlin, Applied speech and audio processing: with Matlab examples. Cambridge University Press. 2009. ISBN 978-0-521-51954-0. [COBISS.SI-ID 7828564] 

  3. J. Davies, M. Grobelnik, D. Mladenić: Semantic knowledge management : integrating ontology management, knowledge discovery, and human language technologies. Springer, 2009. ISBN 978-3-540-88844-4. [COBISS.SI-ID 22434599] 

  4. S. Narayanan, A. Alwan: Text-to-Speech Synthesis, Prentice Hall Professional Technical Reference, 2005. ISBN 0-13-145661-X. [COBISS.SI-ID 4613972] 

Bodi na tekočem

Univerza v Ljubljani, Fakulteta za elektrotehniko, Tržaška cesta 25, 1000 Ljubljana

E:  dekanat@fe.uni-lj.si T:  01 4768 411