Zobrazit minimální záznam

Real-time data stream analysis system



dc.contributor.advisorŠenk Adam
dc.contributor.authorViktora David
dc.date.accessioned2016-10-17T08:39:44Z
dc.date.available2016-10-17T08:39:44Z
dc.date.issued2016-05-17
dc.identifierKOS-587865214405
dc.identifier.urihttp://hdl.handle.net/10467/66194
dc.description.abstractCílem této práce bylo vytvoření systému pro analýzu proudu dat v reálném čase v kontextu velkých objemů dat. Zpracovávanými daty jsou příspěvky ze sociální sítě Twitter. K samotné analýze byl použit framework Apache Spark, výsledky z něj jsou ukládány do klasické relační databáze a zpřístupněny pomocí REST API. V práci se věnuji všem částem vývoje včetně analýzy, návrhu, implementace a testování tohoto systému. Vytvořený systém umožňuje monitorovat přání uživatelů Twitteru. Díky analýze sentimentu těchto příspěvků by po drobných úpravách mohl být vyvinutý systém použit například při provádění předvolebních průzkumů či analýze oblíbenosti produktů vybrané společnosti.cze
dc.description.abstractThe goal of this thesis was to implement a real-time data stream analysis system in the context of Big Data. The data being processed are posts from the Twitter social network. The analysis is implemented using Apache Spark framework, it's results are being saved to relational database and published using REST API. I take care of all development phases, including analysis, design, implementation and testing. The implemented system allows monitoring of Twitter users' wishes. Thanks to analysing the sentiment of these wishes, after some minor changes, the system could be used for pre-election surveys or to analyse given products popularity.eng
dc.language.isoCZE
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfeng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfcze
dc.subjectApache Spark, proudové zpracování dat, Big Data, Twitter, sentimentální analýza, REST APIcze
dc.subjectApache Spark, data stream processing, Big Data, Twitter, sentiment analysis, REST APIeng
dc.titleSystém pro analýzu proudu dat v reálném časecze
dc.titleReal-time data stream analysis systemeng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.date.accepted2016-08-30
dc.contributor.refereeSmítka Jiří
theses.degree.disciplineInformační technologiecze
theses.degree.grantorkatedra počítačových systémůcze
theses.degree.programmeInformatikacze


Soubory tohoto záznamu


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam