ČVUT DSpace
  • Search DSpace
  • Čeština
  • Login
  • Čeština
  • Čeština
View Item 
  •   ČVUT DSpace
  • České vysoké učení technické v Praze
  • Fakulta informačních technologií
  • katedra teoretické informatiky
  • Bakalářské práce - 18101
  • View Item
  • České vysoké učení technické v Praze
  • Fakulta informačních technologií
  • katedra teoretické informatiky
  • Bakalářské práce - 18101
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Paralelní implementace dynamického naivního Bayesovského klasifikátoru

Parallel implementation of dynamic naive Bayesian classifier

Type of document
bakalářská práce
bachelor thesis
Author
Lučivňák Pavel
Supervisor
Šabata Tomáš
Opponent
Šimeček Ivan
Field of study
Teoretická informatika
Study program
Informatika
Institutions assigning rank
katedra teoretické informatiky
Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item record
Abstract
Dynamický naivni Bayesovský klasifikátor (DNBC) nacházi využiti v mnoha oblastech, napřiklad při rozpoznáváni hlasu, pisma, nebo při předpovidáni počasi. DNBC je rozšiřenim skrytého Markovského modelu tim, že pod-poruje vice pozorovaných proměnných. Předpokládá se, že tyto proměnné jsou vzájemně statisticky nezávislé. Tento předpoklad značně zjednodušuje výpočty a nedocházi tak k jevu, který je znamý jako prokleti dimenzionatily. Klasifikátor byl naimplementován v programovacim jazyce Scala, nad platfor-mou Apache Spark. Diky technologii Apache Spark je možné implementaci paralelizovat pomoci Map Reduce paradigmatu. S touto paralelni implemen-taci se mi podařilo dosáhnout dvojnásobného zrychleni při využiti 15 pro-cesorových jader. Demonstroval jsem, že zrychleni lze dosáhnout nejenom vyššim počtem jader, ale i vyššim počtem výpočetnich uzlů v clusteru.
 
Dynamic naive Bayesian classifier (DNBC) has many applications, such as in speech recognition, handwriting recognition or weather prediction. DNBC viiextends a hidden Markov model by supporting multiple observed variables. It is assumed that these variables are mutually statistically independent. This assumption greatly simplifies computations and a phenomenon called curse of dimensionality does not occur. I have implemented the classifier in Scala language on top of Apache Spark. The implementation can be parallelized by using Map Reduce paradigm. I have managed to double the speed up when using 15 processor cores. I have further demonstrated, that the speed up can be achieved not only by increasing the number of cores, but also by increasing the number of machines in a cluster.
 
URI
http://hdl.handle.net/10467/76654
View/Open
PLNY_TEXT (696.0Kb)
POSUDEK (136.1Kb)
POSUDEK (137.8Kb)
Collections
  • Bakalářské práce - 18101 [285]

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Useful links

CTU in PragueCentral library of CTUAbout CTU Digital LibraryResourcesStudy and library skillsResearch support

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV