Implementation of Cepstral Voice Activity Detector within Speech Feature Computation

Implementace kepstrálního detektoru řečové aktivity při výpočtu řečových příznaků

Supervisors

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Date of defense

Research Projects

Organizational Units

Journal Issue

Abstract

Cílem této bakalářské práce bylo vytvořit systém pro detekci přítomnosti řeči v diskrétním signálu. Vytvořený detektor používá krátkodobou energii signálu a změny v kepstrálních charakteristikách signálu jako kriteriální funkci. Pro rozhodnutí o přítomnosti řeči je použito několik různých heuristických metod stanovení prahové hodnoty kriteriální funkce. Implemetace detektoru byla provedena v programovacím jazyce C++ a při běžné výpočetní výkonnosti zvolené platformy je detektor schopen operovat v reálném čase. Detektor byl zaintegrován do softwarového nástroje CtuCopy jako interní funkční modul. V experimentální části bakalářské práce bylo provedeno testování funkčnosti detektoru a zkoumáno chování vytvořeného detektoru v různých akustických prostředích s různou úrovní šumu.

The aim of this bachelor thesis is to create a system for detection of human speech presence in a discrete signal. The created Voice Activity Detector (VAD) uses computation of short-time signal energy and cepstral distance as a criterion value. Several different methods of heuristic thresholding are used for decision making about speech and non-speech activity in current short-time signal segment. The implementation of the created VAD was written in the C++ programming language, allowing the detector to be capable of real-time operation at the average processing performance of a chosen platform. The detector has been integrated into the CtuCopy speech processing tool as an internal functional module. In experimental part of the thesis, VAD functionality has been tested and it's behavior in different acoustic conditions with different noise levels was studied.

Description

Citation

Underlying research data set URL

Rights/License

A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.

Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.

Endorsement

Review

Supplemented By

Referenced By