ČVUT DSpace
  • Search DSpace
  • Čeština
  • Login
  • Čeština
  • Čeština
View Item 
  •   ČVUT DSpace
  • České vysoké učení technické v Praze
  • Fakulta informačních technologií
  • katedra teoretické informatiky
  • Bakalářské práce - 18101
  • View Item
  • České vysoké učení technické v Praze
  • Fakulta informačních technologií
  • katedra teoretické informatiky
  • Bakalářské práce - 18101
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Rozpoznávání souvislé řeči s využitím neuronových sítí

Continuous Speech Recognition by Neural Networks

Type of document
bakalářská práce
bachelor thesis
Author
Zvada Adam
Supervisor
Skrbek Miroslav
Opponent
Šimeček Ivan
Field of study
Teoretická informatika
Study program
Informatika
Institutions assigning rank
katedra teoretické informatiky
Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item record
Abstract
Tato bakalářska práce se zaměřuje na oblast rozpoznávání řeči s pomocí neuronových sítí a klade si za cíl implementovat "end-to-end" rozpoznávač řeči jako hlasové uživatelské rozhraní pro robota NAO. Uvažovaná architektura rozpoznávače řeči je složena ze tří důležitých částí: extrakce příznaků signálu řeči za použtí metody mel-frekvenčních kepstrálních koeficientů, rozpoznávače v podobě rekurentní neuronové sítě s "long-short- term-memory" buňkami a algoritmu "connection temporal classification" k získání finalního převedeného textu. Výsledkem této práce je "end-to-end" rozpoznávač řeči, natrénovaný na VCTK korpusu a implementovaný v programovacím jazyce Python s využitím knihovny hlubokého učení TensorFlow.
 
The aim of this bachelor thesis is to explore the field of speech recognition using neural networks with a goal to implement end-to-end speech recognizer as voice-user interface for robot NAO. The proposed speech recognizer architecture is consisted from three main components: feature extraction of speech signal using mel-frequency cepstrum coefficients method, recognizer as recurrent neural networks with long-short-term-memory cells, and connection temporal classification algorithm for predicting the final transcription. The result of this work is end-to-end speech recognizer trained on VCTK corpus and implemented in programming language Python, using deep learning library TensorFlow.
 
URI
http://hdl.handle.net/10467/76694
View/Open
PLNY_TEXT (3.343Mb)
POSUDEK (141.4Kb)
POSUDEK (136.3Kb)
Collections
  • Bakalářské práce - 18101 [285]

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Useful links

CTU in PragueCentral library of CTUAbout CTU Digital LibraryResourcesStudy and library skillsResearch support

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV