Systém pro analýzu proudu dat v reálném čase
Real-time data stream analysis system
dc.contributor.advisor | Šenk Adam | |
dc.contributor.author | Viktora David | |
dc.date.accessioned | 2016-10-17T08:39:44Z | |
dc.date.available | 2016-10-17T08:39:44Z | |
dc.date.issued | 2016-05-17 | |
dc.identifier | KOS-587865214405 | |
dc.identifier.uri | http://hdl.handle.net/10467/66194 | |
dc.description.abstract | Cílem této práce bylo vytvoření systému pro analýzu proudu dat v reálném čase v kontextu velkých objemů dat. Zpracovávanými daty jsou příspěvky ze sociální sítě Twitter. K samotné analýze byl použit framework Apache Spark, výsledky z něj jsou ukládány do klasické relační databáze a zpřístupněny pomocí REST API. V práci se věnuji všem částem vývoje včetně analýzy, návrhu, implementace a testování tohoto systému. Vytvořený systém umožňuje monitorovat přání uživatelů Twitteru. Díky analýze sentimentu těchto příspěvků by po drobných úpravách mohl být vyvinutý systém použit například při provádění předvolebních průzkumů či analýze oblíbenosti produktů vybrané společnosti. | cze |
dc.description.abstract | The goal of this thesis was to implement a real-time data stream analysis system in the context of Big Data. The data being processed are posts from the Twitter social network. The analysis is implemented using Apache Spark framework, it's results are being saved to relational database and published using REST API. I take care of all development phases, including analysis, design, implementation and testing. The implemented system allows monitoring of Twitter users' wishes. Thanks to analysing the sentiment of these wishes, after some minor changes, the system could be used for pre-election surveys or to analyse given products popularity. | eng |
dc.language.iso | CZE | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | cze |
dc.subject | Apache Spark, proudové zpracování dat, Big Data, Twitter, sentimentální analýza, REST API | cze |
dc.subject | Apache Spark, data stream processing, Big Data, Twitter, sentiment analysis, REST API | eng |
dc.title | Systém pro analýzu proudu dat v reálném čase | cze |
dc.title | Real-time data stream analysis system | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.date.accepted | 2016-08-30 | |
dc.contributor.referee | Smítka Jiří | |
theses.degree.discipline | Informační technologie | cze |
theses.degree.grantor | katedra počítačových systémů | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 18104 [348]