Self-supervised model pro efektivní rozpoznávání zvuku trénovaný na agregovaných datech

Vojtěch Houska

Self-supervised model for efficient sound recognition trained on aggregated data

dc.contributor.advisor	Kovalenko Alexander
dc.contributor.author	Vojtěch Houska
dc.date.accessioned	2021-06-11T22:52:00Z
dc.date.available	2021-06-11T22:52:00Z
dc.date.issued	2021-06-11
dc.identifier	KOS-961987101905
dc.identifier.uri	http://hdl.handle.net/10467/95039
dc.description.abstract	Tato práce shrnuje nejmodernější metody využívané v hlubokém učení. Probírá použití autoenkodérů a metody předzpracování v oblasti rozpoznávání zvuku. Jako zdroj slabě anotovaných dat pro učení těchto modelů byla použita platforma YouTube. Práce porovnala vlastnosti latentních prostorů navrhovaných autoenkoderů, které byly testovány pomocí shlukování K-means. Použitá metoda regularizovaného autoenkodéru nepřekonala náhodně inicializovaný autoenkodér. V závěru práce jsou rozebrány příčiny a byla navrhnuta další doporučení pro pozdější výzkum.	cze
dc.description.abstract	The thesis summarizes state-of-the-art approaches in deep learning. It discusses application of self-supervised autoencoders and pre-processing techniques used in sound recognition. YouTube platform served as a source of weakly-labeled data to train such models. Latent space properties of proposed autoencoders were compared and tested using K-means clustering. Implementation of Adversarially Constrained Autoencoder Interpolation failed to outperform randomly initialized autoencoder. The reasons are further discussed and several recommendations for future research are proposed.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	slabě anotovaná data	cze
dc.subject	rozpoznávání zvuku	cze
dc.subject	hluboké učení	cze
dc.subject	autoenkodéry	cze
dc.subject	nevyvážená data	cze
dc.subject	učení bez učitele	cze
dc.subject	k-means	cze
dc.subject	Adversarially Constrained Autoencoder Interpolation	cze
dc.subject	Weakly-labeled data	eng
dc.subject	Sound classification	eng
dc.subject	Deep learning	eng
dc.subject	Autoencoders	eng
dc.subject	Imbalanced data	eng
dc.subject	Self-supervised learning	eng
dc.subject	K-means	eng
dc.subject	Adversarially Constrained Autoencoder Interpolation	eng
dc.title	Self-supervised model pro efektivní rozpoznávání zvuku trénovaný na agregovaných datech	cze
dc.title	Self-supervised model for efficient sound recognition trained on aggregated data	eng
dc.type	bakalářská práce	cze
dc.type	bachelor thesis	eng
dc.contributor.referee	Kordík Pavel
theses.degree.discipline	Znalostní inženýrství	cze
theses.degree.grantor	katedra aplikované matematiky	cze
theses.degree.programme	Informatika 2009	cze

Soubory tohoto záznamu

Název:: F8-BP-2021-Houska-Vojtech-thes ...
Velikost:: 2.649Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F8-BP-2021-posudek-Kordik_Pavel.pdf
Velikost:: 47.33Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F8-BP-2021-posudek-Kovalenko_A ...
Velikost:: 50.76Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Bakalářské práce - 18105 [366]

Zobrazit minimální záznam