Sum-product-set modely pro učení hustot pravděpodobnosti stromových dat
Sum-product-set networks for density learning of tree-structured data
Type of document
diplomová prácemaster thesis
Author
Martin Rektoris
Supervisor
Šmídl Václav
Opponent
Vomlel Jiří
Study program
Kybernetika a robotikaInstitutions assigning rank
katedra řídicí technikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Výzkum a škálovatelnost výzkumu v oblasti strojového učení se urychlily přechodem od ručního vytváření příznaků k automatické extrakci příznaků. Použití datového formátu JSON v různých oblastech, jako je kybernetická bezpečnost, fyzika nebo biochemie, motivovalo k automatizovanému zpracování i těchto dat. Již dříve se ukázalo, že stromově strukturovaná data zobecňují koncept datového formátu JSON. Byl však navržen pouze způsob diskriminačního učení takových dat. V této práci navrhujeme síť typu SPSN (Sum-Product-Set Network), generativní model pro stromově strukturovaná data založený na explicitním modelování jejich hustoty. Problémy modelování stromově strukturovaných dat řešíme pomocí teorie náhodných konečných množin. Teorie náhodných konečných množin je kombinována s pravděpodobnostním modelem Sum-Product sítí. Experimentální výsledky poskytují hluboký vhled do silných stránek a omezení SPSN v různých datových doménách a zdůrazňují konkurenceschopnost pravděpodobnostních modelů vůči neuronovým sítím. The research and scalability of machine learning research have been accelerated by moving from manual feature engineering to automatic feature extraction. The use of JSON data format in various domains such as cybersecurity, physics or biochemistry development motivated the automated processing of such data. Tree-structured data has previously been shown to generalise the concept of the JSON data format. However, only a mode for discriminative learning of such data has been proposed. In this work, we propose a Sum-Product-Set Network (SPSN), a generative model for tree-structured data based on explicit modelling of its density. We address the challenges of modelling tree-structured data by using the theory of random finite sets. Random finite set theory is combined with a tractable probabilistic model of Sum-Product Networks. The experimental results provide in-depth insights into the strengths and limitations of SPSN in different data domains and highlight the competitiveness of tractable probabilistic models against intractable neural networks.
Collections
- Diplomové práce - 13135 [327]
Related items
Showing items related by title, author, creator and subject.
-
Aplikace bayezovských sítí v plánování výroby
Author: Václav Pazderka; Supervisor: Dohnal Gejza; Opponent: Bukovský Ivo
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-02-09)Bakalářská práce se zabývá popisem a využitím Bayesovských sítí. V teoretické části jsou zavedeny základní pojmy z pravděpodobnosti a teorie grafu. Následně jsou tyto pojmy použity pro popis Bayesovských sítí. V této části ... -
Kategorizace produktů pomocí strojového učení
Author: Roman Dušek; Supervisor: Cejnek Matouš; Opponent: Oswald Cyril
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2022-01-28)Špatně zařazené produktu nejen ovlivňují zákaznickou zkušenost na stránkách webových obchodů, ale také vytváří problémy při vytváření systémů pro doporučování a hledání. V této práci otestuji několik různých modelů založených ... -
Paralelizace sítí typu Sum-Product-Transform pro architekturu GPU
Author: Ondřej Poláček; Supervisor: Oberhuber Tomáš; Opponent: Papež Milan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-05-26)Sítě typu Sum-Product-Transform jsou rozšířením sítí typu Sum-Product pomocí přidání transformačního uzlu. Toto rozšíření zvyšuje výpočetní náročnost všech operací se sítí. Tato práce popisuje implementaci sítí typu ...