Využití strojového učení pro modelování binaurálního slyšení
Utilization of Machine Learning in Binaural Hearing Model
Typ dokumentu
diplomová prácemaster thesis
Autor
Koshkina Ekaterina
Vedoucí práce
Rund František
Oponent práce
Bureš Zbyněk
Studijní obor
Multimediální technikaStudijní program
Komunikace, multimédia a elektronikaInstituce přidělující hodnost
katedra radioelektronikyObhájeno
2017-06-14Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce se zabývá problematikou binaurálního slyšení se zaměřením na lokalizaci zdroje zvuku pomocí strojového učení. Obsahem práce jsou čtyři experimenty s algoritmy detekce úhlu příchozího zvuku. V prvním experimentu je úhel statického zdroje zvuku v přední horizontální polorovině detekován pomocí klasifikátoru k nejbližších sousedů s využitím binaurálních modelů (LSO a MSO). Ve druhém experimentu se určuje poloha statického a pohyblivého zdroje zvuku v přední horizontální polorovině pomocí klasifikátoru k-nejbližších sousedů a umělé neuronové sítě. Výsledky tohoto experimentu jsou na rozdíl od prvního experimentu získány pro spojení výstupů binaurálních modelů a jsou porovnané se subjektivními daty. Další částí práce je aplikace navrženého algoritmu pro klasifikaci úhlu v celé horizontální rovině. Posledním experimentem je lokalizace zvuku ve vertikální rovině. Úspěšnost algoritmů je ověřená na databázi zvukových signálů. Výstupem diplomové práce je systém, který je schopný lokalizovat zdroj zvuku v prostoru z výstupů binaurálních modelů. Systém dosahuje relativně vysoké úspěšnosti. V případě využití klasifikátoru k nejbližších sousedů se průměrná úspěšnost pohybuje okolo 60 % a v případě umělé neuronové sítě okolo 90 %. This diploma thesis deals with the problem of binaural hearing with focus on the sound source localization utilizing machine learning. This work consists of four experimental algorithms of incoming sound detection. In the first experiment, the angle of the static sound source on the frontal horizontal plane is detected by the k Nearest Neighbors classifier and binaural models (LSO and MSO). In the second experiment, the position of static and dynamic sound sources on the frontal horizontal plane is determined by the k-Nearest Neighbors classifier and Artificial Neural Network. In comparison to the first experiment, the results of the second experiment are obtained by combining the binaural models' outputs. These results are compared with the subjective data. The next part of this thesis applies the proposed algorithm to the angle localization on the entire horizontal plane. The last experiment addresses the problem of the sound localization on the vertical plane. The success rate of the algorithms is verified on the database of audio signals. The outcome of this diploma thesis is a system which can locate the sound source in a space from the outputs of the binaural models. The system achieves a high success rate. The average success rate is around 60 % for the k-Nearest Neighbors classifier and about 90 % for Artificial Neural Network.
Kolekce
- Diplomové práce - 13137 [250]