Případová studie využití NoSQL databázi pro část datového skladu VZP
Case study of the use of a NoSQL database for a part of the VZP data warehouse
Typ dokumentu
diplomová prácemaster thesis
Autor
Stanislav Němec
Vedoucí práce
Valenta Michal
Oponent práce
Vadkerti Kristián
Studijní obor
Webové a softwarové inženýrstvíStudijní program
Informatika 2010Instituce přidělující hodnost
katedra softwarového inženýrstvíPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Předmětem této diplomové práce je provedení případové studie použití NoSQL databázových technologií pro část datového skladu Všeobecné zdravotní pojišťovny. To zahrnuje rešerši NoSQL databází, analýzu současného řešení a analýzu typických dotazů do datového skladu. Dalším cílem je výběr dvou NoSQL technologií a jejich porovnání se stávajícím řešením v databázi Oracle. Výsledky tohoto porovnání poslouží jako základ pro rozhodnutí o vhodnosti těchto technologií pro využití v části datového skladu. Na základě analýzy současného řešení a typických dotazů jsem identifikoval požadavky na případné řešení. Na základě těchto požadavků a rešerše NoSQL databází jsem vybral nástroje Apache Impala a kombinaci Apache Impala s Apache HBase. Tato dvě řešení jsem nainstaloval do testovacího prostředí a na ukázkových datech jsem je porovnal se stávajícím řešením v databázi Oracle. Porovnání jsem provedl s pomocí naměřených časů odezvy na poskytnuté typické dotazy. Z dat měření vyplynulo, že s rostoucí velikostí dat si z pohledu odezvy na~ukázkové dotazy vedla lépe vybraná řešení s pomocí NoSQL technologií. The subject of this diploma thesis is to carry out a case study of the use of NoSQL databases as a part of a data warehouse at VZP. That includes a research of NoSQL databases, an analysis of the current solution and an analysis of queries that are commonly issued to the data warehouse. Another partial goal is to select two of the NoSQL databases and compare them to the current solution which is an Oracle Database. The results of this comparison will be utilized when deciding whether the selected technologies are suitable replacements for a part of the data warehouse. I identified some requirements for a potential solution based on the analysis of the current solution and sample queries. Based on these requirements and the research of NoSQL databases, I chose Apache Impala and Apache Impala connected to Apache HBase. I installed these two technologies and compared them to the original solution in Oracle Database using sample data. The comparison was based on measuring response times for the sample queries. The results from the experiments suggest that with increasing volume of data, the selected NoSQL solutions provide better response times for the sample queries.
Kolekce
- Diplomové práce - 18102 [942]