Zobrazit minimální záznam

Implementation of Cepstral Voice Activity Detector within Speech Feature Computation



dc.contributor.advisorMizera Petr
dc.contributor.authorKosek Michal
dc.date.accessioned2018-01-25T21:48:32Z
dc.date.available2018-01-25T21:48:32Z
dc.date.issued2018-01-08
dc.identifierKOS-587864447205
dc.identifier.urihttp://hdl.handle.net/10467/74429
dc.description.abstractCílem této bakalářské práce bylo vytvořit systém pro detekci přítomnosti řeči v diskrétním signálu. Vytvořený detektor používá krátkodobou energii signálu a změny v kepstrálních charakteristikách signálu jako kriteriální funkci. Pro rozhodnutí o přítomnosti řeči je použito několik různých heuristických metod stanovení prahové hodnoty kriteriální funkce. Implemetace detektoru byla provedena v programovacím jazyce C++ a při běžné výpočetní výkonnosti zvolené platformy je detektor schopen operovat v reálném čase. Detektor byl zaintegrován do softwarového nástroje CtuCopy jako interní funkční modul. V experimentální části bakalářské práce bylo provedeno testování funkčnosti detektoru a zkoumáno chování vytvořeného detektoru v různých akustických prostředích s různou úrovní šumu.cze
dc.description.abstractThe aim of this bachelor thesis is to create a system for detection of human speech presence in a discrete signal. The created Voice Activity Detector (VAD) uses computation of short-time signal energy and cepstral distance as a criterion value. Several different methods of heuristic thresholding are used for decision making about speech and non-speech activity in current short-time signal segment. The implementation of the created VAD was written in the C++ programming language, allowing the detector to be capable of real-time operation at the average processing performance of a chosen platform. The detector has been integrated into the CtuCopy speech processing tool as an internal functional module. In experimental part of the thesis, VAD functionality has been tested and it's behavior in different acoustic conditions with different noise levels was studied.eng
dc.language.isoCZE
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectDetektor řečové aktivity,VAD,Výpočet řečových příznaků,Kepstrální analýza,Kepstrální vzdálenostcze
dc.subjectVoice Activity Detector,VAD,Speech Feature Computation,Cepstral analysis,Cepstral Distanceeng
dc.titleImplementace kepstrálního detektoru řečové aktivity při výpočtu řečových příznakůcze
dc.titleImplementation of Cepstral Voice Activity Detector within Speech Feature Computationeng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.date.accepted
dc.contributor.refereeBartošek Jan
theses.degree.disciplineKomunikace a elektronikacze
theses.degree.grantorkatedra teorie obvodůcze
theses.degree.programmeKomunikace, multimédia a elektronikacze


Soubory tohoto záznamu






Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam