WEBový systém pro rozpoznávání řečníka na bázi i-vektorů a x-vektorů
WEB System of Speaker Recognition Based on i-vectors and x-vectors
dc.contributor.advisor | Pollák Petr | |
dc.contributor.author | Marek Vavřínek | |
dc.date.accessioned | 2024-06-19T22:53:40Z | |
dc.date.available | 2024-06-19T22:53:40Z | |
dc.date.issued | 2024-06-19 | |
dc.identifier | KOS-1243608693805 | |
dc.identifier.uri | http://hdl.handle.net/10467/115898 | |
dc.description.abstract | Předložená práce se zabývá návrhem systému pro rozpoznávání řečníků a aplikace s webovým rozhraním pro demonstraci funkčnosti systémů rozpoznávání řečníka. Vlastní rozpoznávání řečníků je realizováno pomocí klasického řešení na základě GMM a tzv. i-vektorů, a následně pomocí moderního přístupu využívajícího neuronovou síť a tzv. x-vektorů. Oba systémy jsou implementované nástrojovou sadou Kaldi, natrénované a následně otestované na datech z databáze SPEECON. Webová aplikace je rozdělena na serverovou část a uživatelské rozhraní. Serverová část aplikace je vyvinuta s použitím frameworku Django, na který je systém Kaldi napojený pomocí kontejnerového řešení Docker, zatímco webové uživatelské rozhraní je vytvořeno pomocí frameworku React. Výsledný webový systém je otestovaný na různých počítačových platformách a použitém hardwaru v reálném on-line provozu. Dle zpětné vazby od uživatelů při používání aplikace nenastaly žádné problémy a systém fungoval správně. Dále byly orientačně potvrzeny výsledky funkčnosti systémů rozpoznávání řečníků. | cze |
dc.description.abstract | This thesis focuses on the design of speaker recognition system and web interface application for demonstrating functionality speaker recognition systems. The speaker recognition itself is first implemented using classical approach based on GMMs and so-called i-vectors, and subsequently through a modern approach utilizing neural network and so-called x-vectors. Both systems are implemented using the Kaldi toolkit and are trained and then tested on data from the SPEECON database. The server part of the final application is developed using the Django framework, with the Kaldi system connected via Docker container solution, while the web user interface is created using the React framework. The resulting web system is tested on various computing platforms and hardware in real-time online operation. According to user feedback, there were no issues when using the application, and the system functioned correctly. Additionally, the performance results of the speaker recognition systems were indicatively confirmed. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | SRE | cze |
dc.subject | GMM | cze |
dc.subject | DNN | cze |
dc.subject | i-vektor | cze |
dc.subject | x-vektor | cze |
dc.subject | Kaldi | cze |
dc.subject | React | cze |
dc.subject | Django | cze |
dc.subject | SRE | eng |
dc.subject | GMM | eng |
dc.subject | DNN | eng |
dc.subject | i-vector | eng |
dc.subject | x-vector | eng |
dc.subject | Kaldi | eng |
dc.subject | React | eng |
dc.subject | Django | eng |
dc.title | WEBový systém pro rozpoznávání řečníka na bázi i-vektorů a x-vektorů | cze |
dc.title | WEB System of Speaker Recognition Based on i-vectors and x-vectors | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Rajnoha Josef | |
theses.degree.discipline | Audiovizuální technika a zpracování signálů | cze |
theses.degree.grantor | katedra radioelektroniky | cze |
theses.degree.programme | Elektronika a komunikace | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 13137 [250]