Modul I: Govorne tehnologije

Opis predmeta

Uvod: opis področja, kratek zgodovinski oris razvoja inteligentnih avdio in govornih sistemov in pomena raziskav in pridobivanja znanj na tem področju za slovenski jezik. 

Osnovne značilnosti slušnega zaznavanja različnih zvokov ter tvorjenja in zaznavanja govora pri govorni komunikaciji med ljudmi. Predstavitve zvočnih in govornih signalov. 

Računalniška obdelava zvočnih in govornih signalov: predobdelava, značilke zvočnega signala, razčlenjevanje govornega signala, zvočne in govorne podatkovne zbirke. 

Sistemi za razpoznavanje različnih zvokov: razpoznavanje okoljskih in živalskih zvokov, razpoznavanje prometnih zvokov, zvočno preverjanje delovanja strojev. 

Sistemi za razpoznavanje govora: verifikacija in identifikacija govorca, razpoznavanje ločeno in vezano izgovorjenih besed ter spontanega govora. Statistično modeliranje akustične in jezikovne predstavitve govora ter njegova  pomenska analiza. 

Umetni govor: zgradba sistemov za umetni govora, grafemsko fonemska pretvorba, modeliranje prozodije, načini tvorjenja umetnega govornega signala. Vrednotenje sistemov za sintezo govora. 

Sistemi, ki omogočajo dialog z računalnikom: zgradba sistemov, upravljanje dialoga, predstavitev znanja, več-modalnost v sistemih za dialog, vrednotenje sistemov za dialog. 

Predmet učimo na programih

Elektrotehnika 2. stopnja

Cilji in kompetence

Cilj predmeta je seznanjanje študentov s področjem strojnega sluha in govornih tehnologij, predstavitev različnih algoritmov, tehnik in metod za doseganje različnih nalog s področja predmeta. 

Metode poučevanja in učenja

  • Predavanja 
  • Sodelovalno učenje 
  • Laboratorijske vaje 
  • Seminarska naloga 

Predvideni študijski rezultati

Po uspešno opravljenem predmetu naj bi bili študenti zmožni: 

  • opredeliti osnove načine za opis, predstavitev, tvorjenje ter razpoznavanje različnih zvočnih in govornih signalov, 
  • opisati osnovne značilnosti, gradnike, načine delovanja in zmogljivosti sistemov strojnega sluha in govornih tehnologij, 
  • uporabiti izbrane programske rešitve za razvoj sistemov strojnega sluha ter sistemov za govorno komunikacijo med človekom in strojem, 
  • razlikovati med različnimi nalogami strojnega sluha in govornih tehnologij ter  metodami predstavitve in obdelave, ki se pri tem uporabljajo, 
  • združiti osnovne postopke predstavitve in obdelave zvočnih signalov v kompleksnejše sisteme za razpoznavanje različnih zvokov ter za razpoznavanje in sintezo govora, 
  • ovrednotiti točnost in zanesljivost delovanja sistemov strojnega sluha in govornih tehnologij. 

Temeljni viri in literatura

  1. Mihelič F., Signali, Založba FE in FRI, Ljubljana, 2014 
  2. Pavešić N., Razpoznavanje vzorcev: uvod v analizo in razumevanje vidnih in slušnih vzorcev, 3. Popravljena in dopolnjena izdaja, Založba FE in FRI, Ljubljana, 2012 
  3. Human and Machine Hearing: Extracting Meaning from Sound, Cambridge University Press, 2017 
  4. Jurafsky D., Martin J. H., Speech and Language Processing, Stanford University, 3. Ed., 2023 

Bodi na tekočem

Univerza v Ljubljani, Fakulteta za elektrotehniko, Tržaška cesta 25, 1000 Ljubljana

E:  dekanat@fe.uni-lj.si T:  01 4768 411