Potlačení akustického hluku pomocí strojového učení
Acoustic Noise Cancellation by Machine Learning
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Artem Yutukov
Vedoucí práce
Kuznetsov Stanislav
Oponent práce
Kordík Pavel
Studijní obor
Znalostní inženýrstvíStudijní program
Informatika 2009Instituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato bakalářská práce obsahuje obecné informace o systémech aktivního potlačování hluku, historii oboru a diskusi o tom, jak můžeme reprezentovat zvuk pro procesy umělé inteligence. Zejména pojednává o využití strojového učení v této oblasti a demonstruje úspěšnost takových systémů, přičemž za základ bere architekturu konvoluční rekurentní neuronové sítě (CRN), kterou představili Tan K. a Wang D. Demonstrační model je navržen tak, aby předpovídal budoucí okna Krátkodobé Fourierove Transformace (STFT), přičemž jako vstupy používá předchozí a nulou doplněná okna STFT. Navržený systém byl vycvičen pomocí přístupu supervizovaného učení a vyhodnocen na základě své schopnosti přesně předpovídat nekolik budoucích oken STFT. Výkonnost systému byla měřena pomocí normalizované střední kvadratické chyby (NMSE) mezi předpovězenými a skutečnými okny STFT. Výsledky ukazují, že systém založený na CRN dosáhuje nízké hodnoty MSE, což svědčí o vysoké úrovni přesnosti při předpovídání budoucích oken STFT. Práce se rovněž zabývá omezeními a možnými vylepšeními navrhovaného systému, jakož i jeho potenciálním použitím v reálných scénářích. Celkově lze říci, že výsledky získané v této práci poskytují cenné poznatky o předzpracování a zpracování zvuku pomocí neuronových sítí a nabízejí slibný základ pro budoucí výzkum v této oblasti. This bachelor thesis contains general information about active noise cancellation systems, the history of the field, and a discussion of how we can represent sound for artificial intelligence processes. In particular, it discusses the use of machine learning in this area, and demonstrates the success of such systems, taking as a basis the convolutional recurrent neural network (CRN) architecture introduced by Tan K. and Wang D. The demonstration model is designed to predict future Short Time Fourier Transform (STFT) windows, using previous and zero-padded STFT windows as inputs. The proposed system was trained using a supervised learning approach and evaluated based on its ability to accurately predict several future STFT windows. The performance of the system was measured using the normalized mean square error (NMSE) between the predicted and actual STFT windows. The results show that the CRN-based system achieved low MSE values, indicating a high level of accuracy in predicting future STFT windows. The paper also discusses the limitations and possible improvements of the proposed system as well as its potential application in real scenarios. Overall, the results obtained in this work provide valuable insights into audio pre-processing and processing using neural networks and offer a promising foundation for future research in this area.
Kolekce
- Bakalářské práce - 18105 [300]