Analýza dotazů v distribuované grafové databázi
Query Analysis on a Distributed Graph Database
dc.contributor.advisor | Valenta Michal | |
dc.contributor.author | Svitáková Lucie | |
dc.date.accessioned | 2019-02-20T10:56:10Z | |
dc.date.available | 2019-02-20T10:56:10Z | |
dc.date.issued | 2019-01-31 | |
dc.identifier | KOS-762877581605 | |
dc.identifier.uri | http://hdl.handle.net/10467/80246 | |
dc.description.abstract | Přestože dnes existuje několik produktů grafových databází určených pro distribuovaná prostředí, jsou v nich obvykle data distribuována na jednotlivé fyzické uzly náhodně, bez pozdější revize zatížení a možné reorganizace dat. Tato práce analyzuje současné praktiky ukládání dat v distribuovaných grafových databázích. Podle této analýzy práce navrhuje a implementuje nový modul pro grafový výpočetní framework TinkerPop, který loguje provoz vygenerovaný dotazy uživatelů. Je rovněž naimplementována samostatná aplikace pro ukládání takovýchto logovaných dat do databáze JanusGraph. Tento program rovněž spouští redistribuční algoritmus navrhující efektivnější uložení dat v clusteru. Existující algoritmus od Vaquera a spol., kompatibilní se systémem Pregel, je aplikován s podstatnými rozšířeními. Výsledkem je návrh reorganizace dat s 70-80% zlepšením komunikace mezi uzly clusteru. Takovýto výsledek je porovnatelný s jinou známou metodou Ja-be-Ja, která však vyžaduje výrazně vyšší výpočetní prostředky. Na druhou stranu metoda v této práci zavádí malou disbalanci na uzlech clusteru. Nakonec tato práce uvádí doporučení pro možná budoucí rozšíření a vylepšení. | cze |
dc.description.abstract | Although products of graph databases intended for distributed environments already exist, the data are usually distributed randomly on particular physical hosts without any subsequent load examination and possible data reorganization. This thesis analyses the current practices of data storage in distributed graph databases. According to this analysis, it designs and implements a new module of the general graph computing framework TinkerPop for logging the traffic generated with user queries. A separate implementation for storage of such logged data in the JanusGraph database is provided. It also executes a redistribution algorithm proposing a more efficient distribution of data. An existing Pregel-compliant algorithm of Vaquero et al. with substantial enhancements is applied. Results with 70-80% improvement of communication among physical hosts of the cluster are obtained, which is comparable to another well-known method Ja-be-Ja with much higher computational demands. On the other hand, the method in this thesis imposes a necessary slight imbalance of the cluster nodes. Finally, this thesis introduces suggestions for future extensions and enhancements. | eng |
dc.language.iso | ENG | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | grafové databáze,rozdělení grafu,redistribuce,NoSQL,JanusGraph,TinkerPop,Pregel | cze |
dc.subject | graph databases,graph partitioning,redistribution,NoSQL,JanusGraph,TinkerPop,Pregel | eng |
dc.title | Analýza dotazů v distribuované grafové databázi | cze |
dc.title | Query Analysis on a Distributed Graph Database | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.date.accepted | 2019-02-05 | |
dc.contributor.referee | Hermann Lukáš | |
theses.degree.discipline | Webové a softwarové inženýrství | cze |
theses.degree.grantor | katedra softwarového inženýrství | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 18102 [1005]