Show simple item record

Continuous Speech Recognition by Neural Networks



dc.contributor.advisorSkrbek Miroslav
dc.contributor.authorZvada Adam
dc.date.accessioned2018-06-19T21:54:42Z
dc.date.available2018-06-19T21:54:42Z
dc.date.issued2018-06-17
dc.identifierKOS-597057475905
dc.identifier.urihttp://hdl.handle.net/10467/76694
dc.description.abstractTato bakalářska práce se zaměřuje na oblast rozpoznávání řeči s pomocí neuronových sítí a klade si za cíl implementovat "end-to-end" rozpoznávač řeči jako hlasové uživatelské rozhraní pro robota NAO. Uvažovaná architektura rozpoznávače řeči je složena ze tří důležitých částí: extrakce příznaků signálu řeči za použtí metody mel-frekvenčních kepstrálních koeficientů, rozpoznávače v podobě rekurentní neuronové sítě s "long-short- term-memory" buňkami a algoritmu "connection temporal classification" k získání finalního převedeného textu. Výsledkem této práce je "end-to-end" rozpoznávač řeči, natrénovaný na VCTK korpusu a implementovaný v programovacím jazyce Python s využitím knihovny hlubokého učení TensorFlow.cze
dc.description.abstractThe aim of this bachelor thesis is to explore the field of speech recognition using neural networks with a goal to implement end-to-end speech recognizer as voice-user interface for robot NAO. The proposed speech recognizer architecture is consisted from three main components: feature extraction of speech signal using mel-frequency cepstrum coefficients method, recognizer as recurrent neural networks with long-short-term-memory cells, and connection temporal classification algorithm for predicting the final transcription. The result of this work is end-to-end speech recognizer trained on VCTK corpus and implemented in programming language Python, using deep learning library TensorFlow.eng
dc.language.isoENG
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectneuronové sítě,rekurentní neuronové sítě,rozpoznávání řeči,TensorFlow,CTC,LSTM,Robot NAO,Pythoncze
dc.subjectneural networks,recurrent neural networks,speech recognition,TensorFlow,CTC,LSTM,Robot NAO,Pythoneng
dc.titleRozpoznávání souvislé řeči s využitím neuronových sítícze
dc.titleContinuous Speech Recognition by Neural Networkseng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.date.accepted
dc.contributor.refereeŠimeček Ivan
theses.degree.disciplineTeoretická informatikacze
theses.degree.grantorkatedra teoretické informatikycze
theses.degree.programmeInformatikacze


Files in this item




This item appears in the following Collection(s)

Show simple item record