Zobrazit minimální záznam

Self-supervised model for efficient sound recognition trained on aggregated data



dc.contributor.advisorKovalenko Alexander
dc.contributor.authorVojtěch Houska
dc.date.accessioned2021-06-11T22:52:00Z
dc.date.available2021-06-11T22:52:00Z
dc.date.issued2021-06-11
dc.identifierKOS-961987101905
dc.identifier.urihttp://hdl.handle.net/10467/95039
dc.description.abstractTato práce shrnuje nejmodernější metody využívané v hlubokém učení. Probírá použití autoenkodérů a metody předzpracování v oblasti rozpoznávání zvuku. Jako zdroj slabě anotovaných dat pro učení těchto modelů byla použita platforma YouTube. Práce porovnala vlastnosti latentních prostorů navrhovaných autoenkoderů, které byly testovány pomocí shlukování K-means. Použitá metoda regularizovaného autoenkodéru nepřekonala náhodně inicializovaný autoenkodér. V závěru práce jsou rozebrány příčiny a byla navrhnuta další doporučení pro pozdější výzkum.cze
dc.description.abstractThe thesis summarizes state-of-the-art approaches in deep learning. It discusses application of self-supervised autoencoders and pre-processing techniques used in sound recognition. YouTube platform served as a source of weakly-labeled data to train such models. Latent space properties of proposed autoencoders were compared and tested using K-means clustering. Implementation of Adversarially Constrained Autoencoder Interpolation failed to outperform randomly initialized autoencoder. The reasons are further discussed and several recommendations for future research are proposed.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectslabě anotovaná datacze
dc.subjectrozpoznávání zvukucze
dc.subjecthluboké učenícze
dc.subjectautoenkodérycze
dc.subjectnevyvážená datacze
dc.subjectučení bez učitelecze
dc.subjectk-meanscze
dc.subjectAdversarially Constrained Autoencoder Interpolationcze
dc.subjectWeakly-labeled dataeng
dc.subjectSound classificationeng
dc.subjectDeep learningeng
dc.subjectAutoencoderseng
dc.subjectImbalanced dataeng
dc.subjectSelf-supervised learningeng
dc.subjectK-meanseng
dc.subjectAdversarially Constrained Autoencoder Interpolationeng
dc.titleSelf-supervised model pro efektivní rozpoznávání zvuku trénovaný na agregovaných datechcze
dc.titleSelf-supervised model for efficient sound recognition trained on aggregated dataeng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeKordík Pavel
theses.degree.disciplineZnalostní inženýrstvícze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatika 2009cze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam