WEBový systém pro rozpoznávání řečníka na bázi i-vektorů a x-vektorů

Marek Vavřínek

WEB System of Speaker Recognition Based on i-vectors and x-vectors

dc.contributor.advisor	Pollák Petr
dc.contributor.author	Marek Vavřínek
dc.date.accessioned	2024-06-19T22:53:40Z
dc.date.available	2024-06-19T22:53:40Z
dc.date.issued	2024-06-19
dc.identifier	KOS-1243608693805
dc.identifier.uri	http://hdl.handle.net/10467/115898
dc.description.abstract	Předložená práce se zabývá návrhem systému pro rozpoznávání řečníků a aplikace s webovým rozhraním pro demonstraci funkčnosti systémů rozpoznávání řečníka. Vlastní rozpoznávání řečníků je realizováno pomocí klasického řešení na základě GMM a tzv. i-vektorů, a následně pomocí moderního přístupu využívajícího neuronovou síť a tzv. x-vektorů. Oba systémy jsou implementované nástrojovou sadou Kaldi, natrénované a následně otestované na datech z databáze SPEECON. Webová aplikace je rozdělena na serverovou část a uživatelské rozhraní. Serverová část aplikace je vyvinuta s použitím frameworku Django, na který je systém Kaldi napojený pomocí kontejnerového řešení Docker, zatímco webové uživatelské rozhraní je vytvořeno pomocí frameworku React. Výsledný webový systém je otestovaný na různých počítačových platformách a použitém hardwaru v reálném on-line provozu. Dle zpětné vazby od uživatelů při používání aplikace nenastaly žádné problémy a systém fungoval správně. Dále byly orientačně potvrzeny výsledky funkčnosti systémů rozpoznávání řečníků.	cze
dc.description.abstract	This thesis focuses on the design of speaker recognition system and web interface application for demonstrating functionality speaker recognition systems. The speaker recognition itself is first implemented using classical approach based on GMMs and so-called i-vectors, and subsequently through a modern approach utilizing neural network and so-called x-vectors. Both systems are implemented using the Kaldi toolkit and are trained and then tested on data from the SPEECON database. The server part of the final application is developed using the Django framework, with the Kaldi system connected via Docker container solution, while the web user interface is created using the React framework. The resulting web system is tested on various computing platforms and hardware in real-time online operation. According to user feedback, there were no issues when using the application, and the system functioned correctly. Additionally, the performance results of the speaker recognition systems were indicatively confirmed.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	SRE	cze
dc.subject	GMM	cze
dc.subject	DNN	cze
dc.subject	i-vektor	cze
dc.subject	x-vektor	cze
dc.subject	Kaldi	cze
dc.subject	React	cze
dc.subject	Django	cze
dc.subject	SRE	eng
dc.subject	GMM	eng
dc.subject	DNN	eng
dc.subject	i-vector	eng
dc.subject	x-vector	eng
dc.subject	Kaldi	eng
dc.subject	React	eng
dc.subject	Django	eng
dc.title	WEBový systém pro rozpoznávání řečníka na bázi i-vektorů a x-vektorů	cze
dc.title	WEB System of Speaker Recognition Based on i-vectors and x-vectors	eng
dc.type	diplomová práce	cze
dc.type	master thesis	eng
dc.contributor.referee	Rajnoha Josef
theses.degree.discipline	Audiovizuální technika a zpracování signálů	cze
theses.degree.grantor	katedra radioelektroniky	cze
theses.degree.programme	Elektronika a komunikace	cze

Soubory tohoto záznamu

Název:: F3-DP-2024-Vavrinek-Marek-dipl ...
Velikost:: 2.343Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F3-DP-2024-Vavrinek-Marek-pril ...
Velikost:: 18.78Mb
Formát:: Neznámý
Popis:: PRILOHA
: Zobrazit/otevřít

Název:: F3-DP-2024-Vavrinek-Marek-pril ...
Velikost:: 44.01Mb
Formát:: Neznámý
Popis:: PRILOHA
: Zobrazit/otevřít

Název:: F3-DP-2024-Vavrinek-Marek-pril ...
Velikost:: 42.08Mb
Formát:: Neznámý
Popis:: PRILOHA
: Zobrazit/otevřít

Název:: F3-DP-2024-posudek-Rajnoha_Jos ...
Velikost:: 277.3Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F3-DP-2024-posudek-Pollak_Petr.pdf
Velikost:: 152.6Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Diplomové práce - 13137 [250]

Zobrazit minimální záznam