Hluboké učení pro relační databáze
Deep Learning for Relational Databases
Typ dokumentu
diplomová prácemaster thesis
Autor
Jakub Peleška
Vedoucí práce
Šír Gustav
Oponent práce
Drchal Jan
Studijní obor
Datové vědyStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Relační databáze uchovávají většinu světových dat. Nicméně jejich potenciál v hlubokém učení je značně nevyužitý. Tato diplomová práce zkoumá integraci hlubokého učení s relačními databázemi, využívajíc komplikovaná vzájemná propojení uložených hodnot. Nedávné pokroky v AI, zejména v modelech hlubokého učení jako jsou transformery a CNN, revolucionalizovaly oblasti zpracování přirozeného jazyka a počítačového vidění díky své schopnosti zpracovávat homogenní data. Avšak data v relačních databázích jsou svou povahou heterogenní a strukturovaná, což představuje výzvy pro tradiční přístupy hlubokého učení. Výzkum se zabývá překážkou v reprezentaci dat tím, že pohlíží na relační databáze jako na heterogenní tabulární grafy, čímž navazuje na nedávné úspěchy v oblasti grafových neuronových sítí. Navrhovaný blueprint poskytuje základy pro hluboké učení nad relačními databázemi. Obecnost navrhovaného blueprintu umožňuje využití stávajících tabulárních modelů a, co je důležité, také integaci transformerů silných na zpracování řetězců dat. Database Transformer vykazuje výborné výsledky, které překonávají současné špičkové metody a tím podtrhuje sílu tohoto frameworku. Relational Databases store the majority of the world's data. However, their use in deep learning is greatly underutilized. This thesis explores the integration of deep learning with relational databases, leveraging the intricate interconnections of the stored values. Recent advancements in AI, particularly in deep learning models like transformers and CNNs, have revolutionized fields of natural language processing and computer vision through their ability to process homogeneous data. Nevertheless, relational database data are inherently heterogeneous and structured, posing challenges for traditional deep-learning approaches. This research addresses the obstacle of data representation by viewing relational databases as heterogeneous tabular graphs, aligning with recent successes in graph neural networks. The proposed blueprint lays down a foundation for deep learning on relational databases. The neural architecture space of the blueprint allows for the employment of existing tabular models and, importantly, the sequence processing transformers. The presented Database Transformer highlights the strength of this framework by displaying promising results that outperform existing state-of-the-art methods.
Kolekce
- Diplomové práce - 13136 [892]