Zobrazit minimální záznam

Software for the detection and classification of acoustic impulse events



dc.contributor.advisorSvatoš Jakub
dc.contributor.authorMichel Jabali
dc.date.accessioned2023-06-19T22:51:37Z
dc.date.available2023-06-19T22:51:37Z
dc.date.issued2023-06-19
dc.identifierKOS-1240440635905
dc.identifier.urihttp://hdl.handle.net/10467/109737
dc.description.abstractTato práce se zabývá detekci akustické události, její trénování a následnou analýzu k rozpoznávání zvuku pomocí automatického akustického softwaru. Mel-frekvenční kepstrální koeficienty (MFCC) byly použity při rozpoznávání mluvčích i při identifikování řeči, především proto, že byly empiricky zkontrolovány a ověřeny, aby dobře fungovaly pro rozpoznávání zvuku obecně kvůli jejich schopnosti zachytit důležité spektrální informace. Tyto koeficienty počítají s mel-frekvenčním logaritmickým rozestupem energií banky filtrů, které napodobují nelineární frekvenční odezvu lidského sluchu. Cílem této práce je vyvinout efektivní systém zpracování audio signálu, který využívá MFCC či jiné spektrální koeficienty pro různé aplikace, jako je detekce zvukových událostí. Nakonec práce hodnotí vyvinutý systém zpracování audio signálu pomocí rozsáhlých experimentů a srovnávací analýzy. Výkon systému je hodnocen z hlediska přesnosti, robustnosti a výpočetní účinnosti. Výsledky demonstrují efektivitu přístupů založených na MFCC při detekci, trénování a rozpoznávání audio signálů pro řadu aplikací. Celkově tato práce přispívá do oblasti zpracování zvukových signálů tím, že poskytuje pohled na aplikaci MFCC pro detekci a rozpoznávání zvukových událostí. Zjištění nabízejí cenné vodítko pro vývoj účinných a přesných systémů pro zpracování zvuku a dláždí cestu pro další pokrok v této oblasti.cze
dc.description.abstractThis thesis deals with detection of an acoustic event, its training and the following analysis to recognize the voice using an automatic acoustic software. Mel-frequency cepstral coefficients (MFCC) have been used in speaker recognition as well as in speech identification, mainly because they have been empirically checked and verified to work well for audio recognition in general due to their ability to capture important spectral information. These coefficients reckon on a mel-frequency logarithmic spacing of filter bank energies that imitate the non-linear frequency response of the human hearing. The objective of this research is to develop an effective audio signal processing system that leverages MFCC or other cepstral coefficients for various applications, such as audio event detection. The thesis evaluates the developed audio signal processing system using extensive experiments and comparative analysis. The system performance is assessed in terms of accuracy, robustness, and computational efficiency. The results show effectiveness of MFCC-based approaches in detecting, training, and recognizing audio signals for a range of applications. Overall, this thesis contributes to the field of audio signal processing by providing insights into the application of MFCCs for audio event detection and recognition. The findings offer valuable guidance for the development of efficient and accurate audio processing systems and pave the way for further advancements in the field.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectAudio signálcze
dc.subjectznakycze
dc.subjectfiltr bankcze
dc.subjectMel-škálovánícze
dc.subjectkepstrální koeficientycze
dc.subjectklasifikacecze
dc.subjectneuronová síťcze
dc.subjecttrénovánícze
dc.subjectAudio signaleng
dc.subjectfeatureeng
dc.subjectfilter bankeng
dc.subjectMel-scaleeng
dc.subjectcepstral coefficientseng
dc.subjectclassificationeng
dc.subjectneural networkeng
dc.subjecttrainingeng
dc.titleSoftware pro detekci a klasifikaci akustických impulzních událostícze
dc.titleSoftware for the detection and classification of acoustic impulse eventseng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeHanuš Ondřej
theses.degree.grantorkatedra měřenícze
theses.degree.programmeKybernetika a robotikacze


Soubory tohoto záznamu







Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam