Odhad modelu nekompletních heterogenních strukturovaných dat
Semisupervised learning of heterogenous structured data
dc.contributor.advisor | Šmídl Václav | |
dc.contributor.author | Michaela Mašková | |
dc.date.accessioned | 2022-06-08T11:51:40Z | |
dc.date.available | 2022-06-08T11:51:40Z | |
dc.date.issued | 2022-05-26 | |
dc.identifier | KOS-1195815860205 | |
dc.identifier.uri | http://hdl.handle.net/10467/101369 | |
dc.description.abstract | Semi-supervised metody se snaží vyřešit problém dostupnosti výstupů pro data v aplikacích strojového učení. Modely jsou navrženy tak, aby se učily z dat se známou i neznámou třídou současně, a to s využitím metrického učení, generativního modelování a samoučení. Modely jsou aplikovány na standardní formáty dat, jako jsou vektory, obrázky nebo text. Tato práce rozšiřuje a zkoumá zavedené metody pro složitější datové struktury, jako jsou skupinová data a JSON soubory, pomocí nového balíčku HMill. Navržené modely jsou vyhodnoceny na třech různých datových sadách z domén víceinstančního učení, shluků bodů a kybernetické bezpečnosti. Vylepšené semi-supervised modely vykazují slibné zlepšení oproti standardním metodám učení s učitelem, ale generativní semi-supervised modely nedosahují dostatečně dobrých výsledků a vyžadují další prozkoumání. | cze |
dc.description.abstract | Semi-supervised learning tries to solve the problem of label availability for data in machine learning applications. Models are designed to learn from labeled and unlabeled data simultaneously, with the use of metric learning, generative modeling, and self-training, and applied to standard data formats such as vectors, images, or text. This thesis extends and explores established methods for more complex data structures such as group data and JSON files, with the help of a novel HMill framework. The models designed are evaluated on three distinct datasets from the domains of multi-instance learning, point clouds, and cybersecurity. Enhanced semi-supervised models show promising improvement over standard supervised methods, but generative semi-supervised models fail to achieve high enough performance and call for further research. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | : shluková analýza | cze |
dc.subject | učení metrik | cze |
dc.subject | semi-supervised učení | cze |
dc.subject | generativní modely | cze |
dc.subject | : clustering | eng |
dc.subject | metric learning | eng |
dc.subject | semi-supervised learning | eng |
dc.subject | generative models | eng |
dc.title | Odhad modelu nekompletních heterogenních strukturovaných dat | cze |
dc.title | Semisupervised learning of heterogenous structured data | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Somol Petr | |
theses.degree.grantor | katedra matematiky | cze |
theses.degree.programme | Aplikované matematicko-stochastické metody | cze |
Files in this item
This item appears in the following Collection(s)
-
Diplomové práce - 14101 [134]