Implementace kepstrálního detektoru řečové aktivity při výpočtu řečových příznaků
Implementation of Cepstral Voice Activity Detector within Speech Feature Computation
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Kosek Michal
Vedoucí práce
Mizera Petr
Oponent práce
Bartošek Jan
Studijní obor
Komunikace a elektronikaStudijní program
Komunikace, multimédia a elektronikaInstituce přidělující hodnost
katedra teorie obvodůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Cílem této bakalářské práce bylo vytvořit systém pro detekci přítomnosti řeči v diskrétním signálu. Vytvořený detektor používá krátkodobou energii signálu a změny v kepstrálních charakteristikách signálu jako kriteriální funkci. Pro rozhodnutí o přítomnosti řeči je použito několik různých heuristických metod stanovení prahové hodnoty kriteriální funkce. Implemetace detektoru byla provedena v programovacím jazyce C++ a při běžné výpočetní výkonnosti zvolené platformy je detektor schopen operovat v reálném čase. Detektor byl zaintegrován do softwarového nástroje CtuCopy jako interní funkční modul. V experimentální části bakalářské práce bylo provedeno testování funkčnosti detektoru a zkoumáno chování vytvořeného detektoru v různých akustických prostředích s různou úrovní šumu. The aim of this bachelor thesis is to create a system for detection of human speech presence in a discrete signal. The created Voice Activity Detector (VAD) uses computation of short-time signal energy and cepstral distance as a criterion value. Several different methods of heuristic thresholding are used for decision making about speech and non-speech activity in current short-time signal segment. The implementation of the created VAD was written in the C++ programming language, allowing the detector to be capable of real-time operation at the average processing performance of a chosen platform. The detector has been integrated into the CtuCopy speech processing tool as an internal functional module. In experimental part of the thesis, VAD functionality has been tested and it's behavior in different acoustic conditions with different noise levels was studied.
Kolekce
- Bakalářské práce - 13131 [127]