Software pro detekci a klasifikaci akustických impulzních událostí
Software for the detection and classification of acoustic impulse events
Typ dokumentu
diplomová prácemaster thesis
Autor
Michel Jabali
Vedoucí práce
Svatoš Jakub
Oponent práce
Hanuš Ondřej
Studijní program
Kybernetika a robotikaInstituce přidělující hodnost
katedra měřeníPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce se zabývá detekci akustické události, její trénování a následnou analýzu k rozpoznávání zvuku pomocí automatického akustického softwaru. Mel-frekvenční kepstrální koeficienty (MFCC) byly použity při rozpoznávání mluvčích i při identifikování řeči, především proto, že byly empiricky zkontrolovány a ověřeny, aby dobře fungovaly pro rozpoznávání zvuku obecně kvůli jejich schopnosti zachytit důležité spektrální informace. Tyto koeficienty počítají s mel-frekvenčním logaritmickým rozestupem energií banky filtrů, které napodobují nelineární frekvenční odezvu lidského sluchu. Cílem této práce je vyvinout efektivní systém zpracování audio signálu, který využívá MFCC či jiné spektrální koeficienty pro různé aplikace, jako je detekce zvukových událostí. Nakonec práce hodnotí vyvinutý systém zpracování audio signálu pomocí rozsáhlých experimentů a srovnávací analýzy. Výkon systému je hodnocen z hlediska přesnosti, robustnosti a výpočetní účinnosti. Výsledky demonstrují efektivitu přístupů založených na MFCC při detekci, trénování a rozpoznávání audio signálů pro řadu aplikací. Celkově tato práce přispívá do oblasti zpracování zvukových signálů tím, že poskytuje pohled na aplikaci MFCC pro detekci a rozpoznávání zvukových událostí. Zjištění nabízejí cenné vodítko pro vývoj účinných a přesných systémů pro zpracování zvuku a dláždí cestu pro další pokrok v této oblasti. This thesis deals with detection of an acoustic event, its training and the following analysis to recognize the voice using an automatic acoustic software. Mel-frequency cepstral coefficients (MFCC) have been used in speaker recognition as well as in speech identification, mainly because they have been empirically checked and verified to work well for audio recognition in general due to their ability to capture important spectral information. These coefficients reckon on a mel-frequency logarithmic spacing of filter bank energies that imitate the non-linear frequency response of the human hearing. The objective of this research is to develop an effective audio signal processing system that leverages MFCC or other cepstral coefficients for various applications, such as audio event detection. The thesis evaluates the developed audio signal processing system using extensive experiments and comparative analysis. The system performance is assessed in terms of accuracy, robustness, and computational efficiency. The results show effectiveness of MFCC-based approaches in detecting, training, and recognizing audio signals for a range of applications. Overall, this thesis contributes to the field of audio signal processing by providing insights into the application of MFCCs for audio event detection and recognition. The findings offer valuable guidance for the development of efficient and accurate audio processing systems and pave the way for further advancements in the field.
Kolekce
- Diplomové práce - 13138 [343]