Sum-product-set modely pro učení hustot pravděpodobnosti stromových dat
Sum-product-set networks for density learning of tree-structured data
dc.contributor.advisor | Šmídl Václav | |
dc.contributor.author | Martin Rektoris | |
dc.date.accessioned | 2024-01-31T23:53:00Z | |
dc.date.available | 2024-01-31T23:53:00Z | |
dc.date.issued | 2024-01-31 | |
dc.identifier | KOS-1240440706205 | |
dc.identifier.uri | http://hdl.handle.net/10467/113433 | |
dc.description.abstract | Výzkum a škálovatelnost výzkumu v oblasti strojového učení se urychlily přechodem od ručního vytváření příznaků k automatické extrakci příznaků. Použití datového formátu JSON v různých oblastech, jako je kybernetická bezpečnost, fyzika nebo biochemie, motivovalo k automatizovanému zpracování i těchto dat. Již dříve se ukázalo, že stromově strukturovaná data zobecňují koncept datového formátu JSON. Byl však navržen pouze způsob diskriminačního učení takových dat. V této práci navrhujeme síť typu SPSN (Sum-Product-Set Network), generativní model pro stromově strukturovaná data založený na explicitním modelování jejich hustoty. Problémy modelování stromově strukturovaných dat řešíme pomocí teorie náhodných konečných množin. Teorie náhodných konečných množin je kombinována s pravděpodobnostním modelem Sum-Product sítí. Experimentální výsledky poskytují hluboký vhled do silných stránek a omezení SPSN v různých datových doménách a zdůrazňují konkurenceschopnost pravděpodobnostních modelů vůči neuronovým sítím. | cze |
dc.description.abstract | The research and scalability of machine learning research have been accelerated by moving from manual feature engineering to automatic feature extraction. The use of JSON data format in various domains such as cybersecurity, physics or biochemistry development motivated the automated processing of such data. Tree-structured data has previously been shown to generalise the concept of the JSON data format. However, only a mode for discriminative learning of such data has been proposed. In this work, we propose a Sum-Product-Set Network (SPSN), a generative model for tree-structured data based on explicit modelling of its density. We address the challenges of modelling tree-structured data by using the theory of random finite sets. Random finite set theory is combined with a tractable probabilistic model of Sum-Product Networks. The experimental results provide in-depth insights into the strengths and limitations of SPSN in different data domains and highlight the competitiveness of tractable probabilistic models against intractable neural networks. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | Sum-Product-Set sítě | cze |
dc.subject | Stromově strukturovaná data | cze |
dc.subject | Pravděpodobnostní učení | cze |
dc.subject | Učení hustoty pravděpodobnosti | cze |
dc.subject | Klasifikace | cze |
dc.subject | Shlukování | cze |
dc.subject | Sum-Product sítě | cze |
dc.subject | Více instanční učení | cze |
dc.subject | Hierarchické více instanční učení | cze |
dc.subject | Sum-Product-Set Networks | eng |
dc.subject | Tree-structured data | eng |
dc.subject | Probabilistic learning | eng |
dc.subject | Density learning | eng |
dc.subject | Classification | eng |
dc.subject | Clustering | eng |
dc.subject | Sum-Product Networks | eng |
dc.subject | Multiple-instance learning | eng |
dc.subject | Hierarchical multiple-instance learning | eng |
dc.title | Sum-product-set modely pro učení hustot pravděpodobnosti stromových dat | cze |
dc.title | Sum-product-set networks for density learning of tree-structured data | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Vomlel Jiří | |
theses.degree.grantor | katedra řídicí techniky | cze |
theses.degree.programme | Kybernetika a robotika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 13135 [327]