Zobrazit minimální záznam

Data flow analysis of scripts in Databricks SQL dialect



dc.contributor.advisorTrávníček Jan
dc.contributor.authorLucie Procházková
dc.date.accessioned2023-06-09T22:52:30Z
dc.date.available2023-06-09T22:52:30Z
dc.date.issued2023-06-09
dc.identifierKOS-1240469504305
dc.identifier.urihttp://hdl.handle.net/10467/108867
dc.description.abstractTato diplomová práce zkoumá dialekt Databricks SQL a navrhuje metodu automatické analýzy skriptů a prototyp skeneru pro nástroj Manta, který se zabývá data lineage. Data lineage je nezbytná pro integritu a správu dat. Výsledky výzkumu zahrnují komplexní analýzu datového toku v Databricks SQL, návrh a implementaci prototypu skeneru a důkladné testování. Tato práce rozšiřuje schopnosti nástroje Manta v práci se systémy Databricks a poskytují cenný analytický nástroj pro organizace, které spoléhají na Databricks SQL pro zpracování dat.cze
dc.description.abstractThis thesis investigates the Databricks SQL dialect, proposing an automatic script analysis method and a prototype scanner unit for Manta, a data lineage tool. Data lineage is essential for data integrity and governance. The research outcomes include a comprehensive data flow analysis in Databricks SQL, the prototype scanner unit design and implementation, and thorough testing. Our contributions enhance Manta's ability to work with Databricks systems, providing a valuable analytic tool for organizations relying on Databricks SQL for data processing.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectDatabrickscze
dc.subjectSQLcze
dc.subjectdata lineagecze
dc.subjectanal yza datov ych tok ucze
dc.subjectManta toolscze
dc.subjectANTLRcze
dc.subjectparsing viiicze
dc.subjectDatabrickseng
dc.subjectSQLeng
dc.subjectdata lineageeng
dc.subjectdata flow analysiseng
dc.subjectManta toolseng
dc.subjectANTLReng
dc.subjectparsingeng
dc.titleAnalýza datových toků v SQL skriptech dialektu Databrickscze
dc.titleData flow analysis of scripts in Databricks SQL dialecteng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeMácha Radek
theses.degree.disciplineTeoretická informatikacze
theses.degree.grantorkatedra teoretické informatikycze
theses.degree.programmeInformatikacze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam