Opis predmeta
V okviru predmeta se študenti seznanijo z razvojem in uporabo inteligentnih avdio in govornih sistemov. Obravnavane so osnovne značilnosti človekovega slušnega zaznavanja ter temeljne metode za analizo in sintezo govornih in drugih zvočnih signalov.
V okviru predmeta se obravnava metode predobdelave in analize značilnosti zajetih zvočnih signalov, ki omogočajo razpoznavanje značilnih zvokov, kot so različni okoljski zvoki ter živalski in prometni zvoki. Pozornost je posvečena tudi možnosti zvočnega preverjanja delovanja strojev in naprav in diagnosticiranja njihovih okvar.
Poseben poudarek je na sistemih za razpoznavanje govora in govorcev ter na statističnem modeliranju govorjenih jezikov. Obravnavani so tudi sistemi za tvorjenje umetnega govora ter sistemi za komunikacijo človek-stroj, pri čemer se obravnava sisteme za upravljanje dialoga, modele za predstavitev znanja, tovrstnih sistemov in tudi več-modalnost v komunikaciji.
Predmet učimo na programih
Elektrotehnika 2. stopnja
Cilji in kompetence
Cilj predmeta je seznanjanje študentov s področjem strojnega sluha in govornih tehnologij, predstavitev različnih algoritmov, tehnik in metod za doseganje različnih nalog s področja predmeta.
Metode poučevanja in učenja
Predavanja, sodelovalno učenje, laboratorijske vaje, seminarska naloga.
Predvideni študijski rezultati
Po uspešno opravljenem predmetu naj bi bili študenti zmožni:
- opredeliti osnove načine za opis, predstavitev, tvorjenje ter razpoznavanje različnih zvočnih in govornih signalov,
- opisati osnovne značilnosti, gradnike, načine delovanja in zmogljivosti sistemov strojnega sluha in govornih tehnologij,
- uporabiti izbrane programske rešitve za razvoj sistemov strojnega sluha ter sistemov za govorno komunikacijo med človekom in strojem,
- razlikovati med različnimi nalogami strojnega sluha in govornih tehnologij ter metodami predstavitve in obdelave, ki se pri tem uporabljajo,
- združiti osnovne postopke predstavitve in obdelave zvočnih signalov v kompleksnejše sisteme za razpoznavanje različnih zvokov ter za razpoznavanje in sintezo govora,
- ovrednotiti točnost in zanesljivost delovanja sistemov strojnega sluha in govornih tehnologij.
Temeljni viri in literatura
-
N. Pavešić: Razpoznavanje vzorcev : uvod v analizo in razumevanje vidnih in slušnih signalov, 3. popravljena in dopolnjena izdaja, Založba FE in FRI, 2012 . ISBN 978-961-243-201-0. [COBISS.SI-ID 260256256]
-
I. McLoughlin, Applied speech and audio processing: with Matlab examples. Cambridge University Press. 2009. ISBN 978-0-521-51954-0. [COBISS.SI-ID 7828564]
-
J. Davies, M. Grobelnik, D. Mladenić: Semantic knowledge management : integrating ontology management, knowledge discovery, and human language technologies. Springer, 2009. ISBN 978-3-540-88844-4. [COBISS.SI-ID 22434599]
-
S. Narayanan, A. Alwan: Text-to-Speech Synthesis, Prentice Hall Professional Technical Reference, 2005. ISBN 0-13-145661-X. [COBISS.SI-ID 4613972]