Analýza dotazů v distribuované grafové databázi
Query Analysis on a Distributed Graph Database
Typ dokumentu
diplomová prácemaster thesis
Autor
Svitáková Lucie
Vedoucí práce
Valenta Michal
Oponent práce
Hermann Lukáš
Studijní obor
Webové a softwarové inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra softwarového inženýrstvíObhájeno
2019-02-05Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Přestože dnes existuje několik produktů grafových databází určených pro distribuovaná prostředí, jsou v nich obvykle data distribuována na jednotlivé fyzické uzly náhodně, bez pozdější revize zatížení a možné reorganizace dat. Tato práce analyzuje současné praktiky ukládání dat v distribuovaných grafových databázích. Podle této analýzy práce navrhuje a implementuje nový modul pro grafový výpočetní framework TinkerPop, který loguje provoz vygenerovaný dotazy uživatelů. Je rovněž naimplementována samostatná aplikace pro ukládání takovýchto logovaných dat do databáze JanusGraph. Tento program rovněž spouští redistribuční algoritmus navrhující efektivnější uložení dat v clusteru. Existující algoritmus od Vaquera a spol., kompatibilní se systémem Pregel, je aplikován s podstatnými rozšířeními. Výsledkem je návrh reorganizace dat s 70-80% zlepšením komunikace mezi uzly clusteru. Takovýto výsledek je porovnatelný s jinou známou metodou Ja-be-Ja, která však vyžaduje výrazně vyšší výpočetní prostředky. Na druhou stranu metoda v této práci zavádí malou disbalanci na uzlech clusteru. Nakonec tato práce uvádí doporučení pro možná budoucí rozšíření a vylepšení. Although products of graph databases intended for distributed environments already exist, the data are usually distributed randomly on particular physical hosts without any subsequent load examination and possible data reorganization. This thesis analyses the current practices of data storage in distributed graph databases. According to this analysis, it designs and implements a new module of the general graph computing framework TinkerPop for logging the traffic generated with user queries. A separate implementation for storage of such logged data in the JanusGraph database is provided. It also executes a redistribution algorithm proposing a more efficient distribution of data. An existing Pregel-compliant algorithm of Vaquero et al. with substantial enhancements is applied. Results with 70-80% improvement of communication among physical hosts of the cluster are obtained, which is comparable to another well-known method Ja-be-Ja with much higher computational demands. On the other hand, the method in this thesis imposes a necessary slight imbalance of the cluster nodes. Finally, this thesis introduces suggestions for future extensions and enhancements.
Kolekce
- Diplomové práce - 18102 [1036]
Související záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Prieskum techník grafových neurónových sietí
Autor: Barbara Bobeničová; Vedoucí práce: Čepek Miroslav; Oponent práce: Rybář Vojtěch
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-23)Táto práca sa venuje rozboru metód grafových neurónových sietí pre klasifikáciu vrcholov a grafov. Skúma súčasné knižnice na prácu s grafovými neurónovými sieťami ako StellarGraph, PyTorch Geometric a DGL. Na vybraných ... -
Využití grafových databází pro pokročilou analýzu dat
Autor: Juraj Polačok; Vedoucí práce: Sušický Marek; Oponent práce: Valenta Michal
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2019-06-08)Práca sa zaoberá rešeršou dostupných grafových databáz, ktoré podporujú horizontálne škálovanie. Práca sa snaží stručne vysvetliť základné technológie, ktoré sa využívajú v spomínaných grafových distribuovaných databázach. ... -
Indexování struktur v grafovém DB stroji neo4j I
Autor: Troup Martin; Vedoucí práce: Valenta Michal; Oponent práce: Bachman Michal
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2015-06-29)V této práci je představena nová metoda pro indexování grafových vzorů v grafové databázi. Metoda je navržena a implementována pro grafovou databázi Neo4j. Metoda umožňuje vytváření, používání a aktualizování indexů, které ...