Izolace byznysové logiky reprezentované pomocí ETL procesů za pomoci strojového učení
Isolation of Business Logic Represented by ETL Processes by Machine Learning Algorithms
dc.contributor.advisor | Hála Petr | |
dc.contributor.author | Juraj Žilt | |
dc.date.accessioned | 2023-06-15T22:52:53Z | |
dc.date.available | 2023-06-15T22:52:53Z | |
dc.date.issued | 2023-06-15 | |
dc.identifier | KOS-1176616985605 | |
dc.identifier.uri | http://hdl.handle.net/10467/109420 | |
dc.description.abstract | Moderní společnost si v dnešní době může udržet svou existenci pouze díky kvalitním datům a jejich analýze. Data se obvykle sbírají a analyzují několik desetiletí. Bohužel spolu s daty na různých platformách roste i počet transformací Business intelligence. Když se všechna data chtějí přenést do cloudu, je třeba tyto transformace modernizovat. Cílem této bakalářské práce je vytvořit posloupnost algoritmů schopných rozpoznat úlohy Business intelligence. Tato práce využívá techniky detekce plagiátů k odhalení technické struktury opakujících se zdrojových kódů. Nesupervizovaná technika Uniform Manifold Approximation and Projection pro redukci dimenze později analyzuje identifikované struktury. Výstup slouží jako vstup pro další nesupervizovnou metodu, Hierarchical Density-Based Spatial Clustering of Applications with Noise, která generuje přiřazení pro redukovanou dimenzi. Tyto přiřazení jsou považovány za Business intelligence a jsou interpretovány rozhodovacími stromy natrénovanými na neredukovaných datech. Výsledky dokazují funkčnost zvolených algoritmů, které dokázaly odhalit příkazy ve zdrojových kódech SQL definující jednotlivé úlohy používané v celém množství souborů. | cze |
dc.description.abstract | A modern company nowadays can only keep its existence with good data and data analysis. The data is usually collected and analyzed over multiple decades. Unfortunately, the number of Business intelligence transformations grows with the data on various platforms. When all the data want to be transferred into the cloud, these transformations need to be modernized. This bachelor thesis aims to create a stream of algorithms able to recognize Business intelligence tasks. This thesis uses plagiarism detection techniques to detect the technical structure of the repetitive source codes. The unsupervised learning technique Uniform Manifold Approximation and Projection for dimension reduction later analyzes the identified structures. The output serves as input for another unsupervised method, the Hierarchical Density-Based Spatial Clustering of Applications with Noise, which generates labels for the reduced dimension. These labels are considered Business intelligence and interpreted by decision trees trained on unreduced data. The results prove the functionality of the chosen algorithms, which were able to detect statements in the SQL source codes defining the individual tasks used throughout the multiple files. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | Business inteligence | cze |
dc.subject | Shoda sekvencí | cze |
dc.subject | Detekce logiky SQL | cze |
dc.subject | Business inteligence | eng |
dc.subject | Matching sequances | eng |
dc.subject | SQL logic detection | eng |
dc.title | Izolace byznysové logiky reprezentované pomocí ETL procesů za pomoci strojového učení | cze |
dc.title | Isolation of Business Logic Represented by ETL Processes by Machine Learning Algorithms | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Wang Yuanhong | |
theses.degree.discipline | Základy umělé inteligence a počítačových věd | cze |
theses.degree.grantor | katedra kybernetiky | cze |
theses.degree.programme | Otevřená informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 13133 [777]