Zobrazit minimální záznam

Modern Techniques of Speaker Recognition Based on GMM and DNN



dc.contributor.advisorPollák Petr
dc.contributor.authorZáruba Michael
dc.date.accessioned2017-07-08T13:58:25Z
dc.date.available2017-07-08T13:58:25Z
dc.date.issued2016-12-22
dc.identifierKOS-596783208905
dc.identifier.urihttp://hdl.handle.net/10467/70962
dc.description.abstractTato práce sModerní metody rozpoznávání mluvčího na bázi GMM a DNNe zabývá úlohou hlasové identifikace a verifikace mluvčího. Jejím hlavním cílem je popsat v současné době nejpoužívanější postupy a vybrané metody experimentálně ověřit na dostupných datech. Hlavní pozornost je věnovaná především statistickému modelování na bázi GMM, respektive reprezentaci mluvčích založené na i-vektorech. Dále se práce zaměřuje na metody zvýšení přesnosti identifikace na bázi lineární diskriminační analýzy (LDA), respektive pravděpodobnostní lineární diskriminační analýzy (PLDA). V praktické části byly výše popsané metody realizovány pomocí nástrojů sady KALDI. Přesnost identifikace a verifikace byla otestována na dvou českých databázích, SPEECON a SpeechDat, a to pro různé vstupní podmínky a parametry úlohy. Během realizace byly vytvořeny skripty ("recepty") v souladu se zavedenými standardy sady KALDI. Nejlepších výsledků bylo dosaženo u databáze SPEECON, u které se podařilo pomocí metody PLDA bezchybně identifikovat a verifikovat 284 rozpoznávaných mluvčích. Implementace může být případně později rozšířena za účelem otestování dalších parametrů úlohy nebo jiných databází. Výsledky předložené práce mohou také posloužit při implementaci úlohy hlasové identifikace či verifikace řečníka v reálném provozu.cze
dc.description.abstractThe present thesis describes voice-based speaker identification and verification, and its main objective is to describe currently the most frequently used techniques and to realize experiments with selected methods using available speech data. The main attention is paied to statistical modelling based on GMM and the representation of speakers based on i-vectors. Further, the attention is turned to methods used to increase the precision of identification, i.e. techniques based on linear discriminant analysis (LDA) or probabilistic linear discriminant analysis (PLDA). In the practical part, described methods were implemented using the KALDI toolkit, and the accuracy of identification and verification was tested for various input conditions and algorithm setups. Two available Czech speech databases, SPEECON and SpeechDat, were used for realized experiments. Throughout the implementation, scripts ("recipes") were created in accordance with approved standards of the KALDI toolkit. The best results were obtained for the PLDA method and SPEECON speech data, where 284 tested speakers were successfully identified and verified with zero error. The implementation may be expanded, with the purpose to include the testing of other algorithms or used speech databases. The results of presented thesis may contribute the implementation of voice-based speaker identification or verification within a real application.eng
dc.language.isoCZE
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectrozpoznávání mluvčího, identifikace mluvčího, verifikace mluvčího, GMM, UBM, i-vektor, KALDIcze
dc.subjectspeaker recognition, identification of speaker, speaker verification, GMM, UBM, i-vector, KALDIeng
dc.titleModerní metody rozpoznávání mluvčího na bázi GMM a DNNcze
dc.titleModern Techniques of Speaker Recognition Based on GMM and DNNeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.date.accepted2017-02-01
dc.contributor.refereeRajnoha Josef
theses.degree.disciplineKomunikační systémycze
theses.degree.grantorkatedra radioelektronikycze
theses.degree.programmeKomunikace, multimédia a elektronikacze


Soubory tohoto záznamu





Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam