Zobrazit minimální záznam

Voice Activity Detector based on Neural Networks with Advanced Structures



dc.contributor.advisorPollák Petr
dc.contributor.authorDavid Machát
dc.date.accessioned2020-09-04T13:51:25Z
dc.date.available2020-09-04T13:51:25Z
dc.date.issued2020-08-26
dc.identifierKOS-960815652205
dc.identifier.urihttp://hdl.handle.net/10467/89935
dc.description.abstractTato diplomová práce se zabývá návrhem a realizací detektoru řečové aktivity za pomoci hlubokých neuronových sítí a konvolučních neuronových sítí. V teoretické části se práce zaměřuje na shrnutí základních poznatků z oblastí zpracování řečového signálu a strojového učení. Dále obsahuje přehled využití metod strojového učení v oblasti automatického rozpoznávání řeči. Experimentální část práce obsahuje návrh detektoru řečové aktivity za pomoci konvoluční neuronové sítě a jeho implementaci pomocí sady nástrojů Kaldi. Dále je zkoumán vliv změn parametrů sítě a vstupních dat na efektivitu detektoru. Na závěr je zkoumána funkčnost detektoru při práci s různými typy a úrovněmi šumu nad databázemi TIMIT a QUT-TIMIT.cze
dc.description.abstractThis thesis deals with the realization of voice activity detector based on deep neural networks and convolutional neural networks. Theoretical part focuses on general overview of speech processing and machine learning. There is also a survey of applications of machine learning in automatic speech recognition. Experimental part contains proposed voice activity detector based on convolutional neural networks and its implementation in Kaldi toolkit. Effect of changing network parameters and input data on the effectivity of the detector is examined. Effectivity of proposed detector is also evaluated based on data with various types and levels of noise from TIMIT and QUT-TIMIT databases.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectkonvoluční neuronové sítěcze
dc.subjectautomatické rozpoznávání řečicze
dc.subjectdetekce řečové aktivitycze
dc.subjectKaldicze
dc.subjectconvolutional neural networkseng
dc.subjectautomatic speech recognitioneng
dc.subjectvoice activity detectioneng
dc.subjectKaldieng
dc.titleDetektor řečové aktivity s pokročilými strukturami neuronových sítícze
dc.titleVoice Activity Detector based on Neural Networks with Advanced Structureseng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeRajnoha Josef
theses.degree.disciplineKomunikace a zpracování signálucze
theses.degree.grantorkatedra radioelektronikycze
theses.degree.programmeOtevřené elektronické systémycze


Soubory tohoto záznamu





Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam