Distribuované dotazování nad XML daty jazykem XPath realizované pomocí Spark frameworku
Distributed Querying of XML Data Using XPath Realised by Spark Framework
Type of document
diplomová prácemaster thesis
Author
Dlouhý Martin
Supervisor
Šenk Adam
Opponent
Janeček Jan
Field of study
Počítačové systémy a sítěStudy program
InformatikaInstitutions assigning rank
katedra počítačových systémůDefended
2015-06-11Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Show full item recordAbstract
Tato práce spadá do oblasti distribuovaných výpočtů. Věnuje se problému zpracování velkého množství dat v oblasti NoSQL databází.
Cílem práce je prozkoumat možnosti distribuovaného XPath dotazování pomocí Spark frameworku.
V práci byly implementovány sady testovacích XPath dotazů, které jsou vykonávány pomocí Spark frameworku.
Práce dále poskytuje srovnání výkonnosti tohoto řešení na clusterech s jedním až třemi výpočetními uzly.
Přínosem této práce je nový pohled na možnost vykonávání distribuovaných dotazů nad XML dokumenty. This diplom work belongs to the area of distributed computing. It deals with problem of processing large amounts of data in the area NoSQL databases.
The aim of this diplom work is to explore possibilities of distributed Xpath inguiring with the help of the Spark framework. In this diplom work were implemented sets of test XPath inguiries which are executed with the help of the Spark framework.
The diplom work also provides comparison of the efficiency of this solution on clusters with one, two or three computing nodes.
The contribution of the work is the new look to the possibility of executing distributed inguiries above the XML documents.
Collections
- Diplomové práce - 18104 [174]