Analýza datových toků v SQL skriptech dialektu Databricks
Data flow analysis of scripts in Databricks SQL dialect
dc.contributor.advisor | Trávníček Jan | |
dc.contributor.author | Lucie Procházková | |
dc.date.accessioned | 2023-06-09T22:52:30Z | |
dc.date.available | 2023-06-09T22:52:30Z | |
dc.date.issued | 2023-06-09 | |
dc.identifier | KOS-1240469504305 | |
dc.identifier.uri | http://hdl.handle.net/10467/108867 | |
dc.description.abstract | Tato diplomová práce zkoumá dialekt Databricks SQL a navrhuje metodu automatické analýzy skriptů a prototyp skeneru pro nástroj Manta, který se zabývá data lineage. Data lineage je nezbytná pro integritu a správu dat. Výsledky výzkumu zahrnují komplexní analýzu datového toku v Databricks SQL, návrh a implementaci prototypu skeneru a důkladné testování. Tato práce rozšiřuje schopnosti nástroje Manta v práci se systémy Databricks a poskytují cenný analytický nástroj pro organizace, které spoléhají na Databricks SQL pro zpracování dat. | cze |
dc.description.abstract | This thesis investigates the Databricks SQL dialect, proposing an automatic script analysis method and a prototype scanner unit for Manta, a data lineage tool. Data lineage is essential for data integrity and governance. The research outcomes include a comprehensive data flow analysis in Databricks SQL, the prototype scanner unit design and implementation, and thorough testing. Our contributions enhance Manta's ability to work with Databricks systems, providing a valuable analytic tool for organizations relying on Databricks SQL for data processing. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | Databricks | cze |
dc.subject | SQL | cze |
dc.subject | data lineage | cze |
dc.subject | anal yza datov ych tok u | cze |
dc.subject | Manta tools | cze |
dc.subject | ANTLR | cze |
dc.subject | parsing viii | cze |
dc.subject | Databricks | eng |
dc.subject | SQL | eng |
dc.subject | data lineage | eng |
dc.subject | data flow analysis | eng |
dc.subject | Manta tools | eng |
dc.subject | ANTLR | eng |
dc.subject | parsing | eng |
dc.title | Analýza datových toků v SQL skriptech dialektu Databricks | cze |
dc.title | Data flow analysis of scripts in Databricks SQL dialect | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Mácha Radek | |
theses.degree.discipline | Teoretická informatika | cze |
theses.degree.grantor | katedra teoretické informatiky | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 18101 [216]