Evaluation of XPath queries over XML documents using SparkSQL framework
Evaluation of XPath queries over XML documents using SparkSQL framework
dc.contributor.advisor | Šenk Adam | |
dc.contributor.author | Hricov Radoslav | |
dc.date.accessioned | 2016-06-22T19:49:14Z | |
dc.date.available | 2016-06-22T19:49:14Z | |
dc.date.issued | 2016-02-09 | |
dc.identifier | KOS-587864456705 | |
dc.identifier.uri | http://hdl.handle.net/10467/65069 | |
dc.description.abstract | Cieľom tejto práce je implementovať podmnožinu výrazov jazyka XPath pomocou systému Spark SQL. Prvá časť práce je zameraná na predstavenie projektu Apache Spark. Druhá časť pokrýva analýzu možnosti mapovania XML dokumentov do formy tabuľky použitím kódovania prvkov, ktoré zachováva ich poradie v rámci dokumentu. V druhej časti je taktiež popísaných niekoľko spôsobov riešenia, ktoré využívajú funkcie systému Spark. Tretia časť tejto práce je zameraná na implementáciu a testovanie navrhnutého riešenia. | cze |
dc.description.abstract | The main goal of this thesis is to use Spark SQL framework to implement a subset of expressions from XPath query language. The first part of this thesis is focused on introducing the Apache Spark project. The second part covers analysis of mapping XML documents into the tabular form using an encoding of nodes that keeps a document order. Also the approach to the solution that uses Spark's features is described in the second part. The third part of the thesis is focused on implementation and testing of designed solution. | eng |
dc.language.iso | ENG | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | cze |
dc.subject | XML, XPath, SQL, Spark, Spark SQL, DataFrame, Dewey order encoding | cze |
dc.subject | XML, XPath, SQL, Spark, Spark SQL, DataFrame, Dewey order encoding | eng |
dc.title | Evaluation of XPath queries over XML documents using SparkSQL framework | cze |
dc.title | Evaluation of XPath queries over XML documents using SparkSQL framework | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.date.accepted | 2016-06-14 | |
dc.contributor.referee | Kroha Petr | |
theses.degree.discipline | Webové a softwarové inženýrství | cze |
theses.degree.grantor | 18102 | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 18102 [1006]