Zobrazit minimální záznam

Utilization of Machine Learning in Binaural Hearing Model



dc.contributor.advisorRund František
dc.contributor.authorKoshkina Ekaterina
dc.date.accessioned2017-06-07T09:44:13Z
dc.date.available2017-06-07T09:44:13Z
dc.date.issued2017-05-25
dc.identifierKOS-695599613705
dc.identifier.urihttp://hdl.handle.net/10467/68455
dc.description.abstractTato práce se zabývá problematikou binaurálního slyšení se zaměřením na lokalizaci zdroje zvuku pomocí strojového učení. Obsahem práce jsou čtyři experimenty s algoritmy detekce úhlu příchozího zvuku. V prvním experimentu je úhel statického zdroje zvuku v přední horizontální polorovině detekován pomocí klasifikátoru k nejbližších sousedů s využitím binaurálních modelů (LSO a MSO). Ve druhém experimentu se určuje poloha statického a pohyblivého zdroje zvuku v přední horizontální polorovině pomocí klasifikátoru k-nejbližších sousedů a umělé neuronové sítě. Výsledky tohoto experimentu jsou na rozdíl od prvního experimentu získány pro spojení výstupů binaurálních modelů a jsou porovnané se subjektivními daty. Další částí práce je aplikace navrženého algoritmu pro klasifikaci úhlu v celé horizontální rovině. Posledním experimentem je lokalizace zvuku ve vertikální rovině. Úspěšnost algoritmů je ověřená na databázi zvukových signálů. Výstupem diplomové práce je systém, který je schopný lokalizovat zdroj zvuku v prostoru z výstupů binaurálních modelů. Systém dosahuje relativně vysoké úspěšnosti. V případě využití klasifikátoru k nejbližších sousedů se průměrná úspěšnost pohybuje okolo 60 % a v případě umělé neuronové sítě okolo 90 %.cze
dc.description.abstractThis diploma thesis deals with the problem of binaural hearing with focus on the sound source localization utilizing machine learning. This work consists of four experimental algorithms of incoming sound detection. In the first experiment, the angle of the static sound source on the frontal horizontal plane is detected by the k Nearest Neighbors classifier and binaural models (LSO and MSO). In the second experiment, the position of static and dynamic sound sources on the frontal horizontal plane is determined by the k-Nearest Neighbors classifier and Artificial Neural Network. In comparison to the first experiment, the results of the second experiment are obtained by combining the binaural models' outputs. These results are compared with the subjective data. The next part of this thesis applies the proposed algorithm to the angle localization on the entire horizontal plane. The last experiment addresses the problem of the sound localization on the vertical plane. The success rate of the algorithms is verified on the database of audio signals. The outcome of this diploma thesis is a system which can locate the sound source in a space from the outputs of the binaural models. The system achieves a high success rate. The average success rate is around 60 % for the k-Nearest Neighbors classifier and about 90 % for Artificial Neural Network.eng
dc.language.isoCZE
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectbinaurální model slyšení, LSO, MSO, azimut, elevace, lokalizace, statický zdroj zvuku, pohyblivý zdroj zvuku, extrakce příznaků, RMS, klasifikace, k-NN, ANN,MATLABcze
dc.subjectbinaural auditory model, LSO, MSO, azimuth, elevation, localization, static sound source, dynamic sound source, feature extraction, RMS, classification, k NN, ANN, MATLABeng
dc.titleVyužití strojového učení pro modelování binaurálního slyšenícze
dc.titleUtilization of Machine Learning in Binaural Hearing Modeleng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.date.accepted2017-06-14
dc.contributor.refereeBureš Zbyněk
theses.degree.disciplineMultimediální technikacze
theses.degree.grantorkatedra radioelektronikycze
theses.degree.programmeKomunikace, multimédia a elektronikacze


Soubory tohoto záznamu
















Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam