ČVUT DSpace
  • Prohledat DSpace
  • English
  • Přihlásit se
  • English
  • English
Zobrazit záznam 
  •   ČVUT DSpace
  • České vysoké učení technické v Praze
  • Fakulta elektrotechnická
  • katedra radioelektroniky
  • Diplomové práce - 13137
  • Zobrazit záznam
  • České vysoké učení technické v Praze
  • Fakulta elektrotechnická
  • katedra radioelektroniky
  • Diplomové práce - 13137
  • Zobrazit záznam
JavaScript is disabled for your browser. Some features of this site may not work without it.

Detektor řečové aktivity s pokročilými strukturami neuronových sítí

Voice Activity Detector based on Neural Networks with Advanced Structures

Typ dokumentu
diplomová práce
master thesis
Autor
David Machát
Vedoucí práce
Pollák Petr
Oponent práce
Rajnoha Josef
Studijní obor
Komunikace a zpracování signálu
Studijní program
Otevřené elektronické systémy
Instituce přidělující hodnost
katedra radioelektroniky



Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznam
Abstrakt
Tato diplomová práce se zabývá návrhem a realizací detektoru řečové aktivity za pomoci hlubokých neuronových sítí a konvolučních neuronových sítí. V teoretické části se práce zaměřuje na shrnutí základních poznatků z oblastí zpracování řečového signálu a strojového učení. Dále obsahuje přehled využití metod strojového učení v oblasti automatického rozpoznávání řeči. Experimentální část práce obsahuje návrh detektoru řečové aktivity za pomoci konvoluční neuronové sítě a jeho implementaci pomocí sady nástrojů Kaldi. Dále je zkoumán vliv změn parametrů sítě a vstupních dat na efektivitu detektoru. Na závěr je zkoumána funkčnost detektoru při práci s různými typy a úrovněmi šumu nad databázemi TIMIT a QUT-TIMIT.
 
This thesis deals with the realization of voice activity detector based on deep neural networks and convolutional neural networks. Theoretical part focuses on general overview of speech processing and machine learning. There is also a survey of applications of machine learning in automatic speech recognition. Experimental part contains proposed voice activity detector based on convolutional neural networks and its implementation in Kaldi toolkit. Effect of changing network parameters and input data on the effectivity of the detector is examined. Effectivity of proposed detector is also evaluated based on data with various types and levels of noise from TIMIT and QUT-TIMIT databases.
 
URI
http://hdl.handle.net/10467/89935
Zobrazit/otevřít
PLNY_TEXT (1.049Mb)
PRILOHA (11.53Mb)
POSUDEK (150.8Kb)
POSUDEK (296.6Kb)
Kolekce
  • Diplomové práce - 13137 [271]

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Kontaktujte nás | Vyjádření názoru
Theme by 
@mire NV
 

 

Užitečné odkazy

ČVUT v PrazeÚstřední knihovna ČVUTO digitální knihovně ČVUTInformační zdrojePodpora studiaPodpora publikování

Procházet

Vše v DSpaceKomunity a kolekceDle data publikováníAutořiNázvyKlíčová slovaTato kolekceDle data publikováníAutořiNázvyKlíčová slova

Můj účet

Přihlásit se

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Kontaktujte nás | Vyjádření názoru
Theme by 
@mire NV