Odhad modelu nekompletních heterogenních strukturovaných dat

Michaela Mašková

Semisupervised learning of heterogenous structured data

dc.contributor.advisor	Šmídl Václav
dc.contributor.author	Michaela Mašková
dc.date.accessioned	2022-06-08T11:51:40Z
dc.date.available	2022-06-08T11:51:40Z
dc.date.issued	2022-05-26
dc.identifier	KOS-1195815860205
dc.identifier.uri	http://hdl.handle.net/10467/101369
dc.description.abstract	Semi-supervised metody se snaží vyřešit problém dostupnosti výstupů pro data v aplikacích strojového učení. Modely jsou navrženy tak, aby se učily z dat se známou i neznámou třídou současně, a to s využitím metrického učení, generativního modelování a samoučení. Modely jsou aplikovány na standardní formáty dat, jako jsou vektory, obrázky nebo text. Tato práce rozšiřuje a zkoumá zavedené metody pro složitější datové struktury, jako jsou skupinová data a JSON soubory, pomocí nového balíčku HMill. Navržené modely jsou vyhodnoceny na třech různých datových sadách z domén víceinstančního učení, shluků bodů a kybernetické bezpečnosti. Vylepšené semi-supervised modely vykazují slibné zlepšení oproti standardním metodám učení s učitelem, ale generativní semi-supervised modely nedosahují dostatečně dobrých výsledků a vyžadují další prozkoumání.	cze
dc.description.abstract	Semi-supervised learning tries to solve the problem of label availability for data in machine learning applications. Models are designed to learn from labeled and unlabeled data simultaneously, with the use of metric learning, generative modeling, and self-training, and applied to standard data formats such as vectors, images, or text. This thesis extends and explores established methods for more complex data structures such as group data and JSON files, with the help of a novel HMill framework. The models designed are evaluated on three distinct datasets from the domains of multi-instance learning, point clouds, and cybersecurity. Enhanced semi-supervised models show promising improvement over standard supervised methods, but generative semi-supervised models fail to achieve high enough performance and call for further research.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	: shluková analýza	cze
dc.subject	učení metrik	cze
dc.subject	semi-supervised učení	cze
dc.subject	generativní modely	cze
dc.subject	: clustering	eng
dc.subject	metric learning	eng
dc.subject	semi-supervised learning	eng
dc.subject	generative models	eng
dc.title	Odhad modelu nekompletních heterogenních strukturovaných dat	cze
dc.title	Semisupervised learning of heterogenous structured data	eng
dc.type	diplomová práce	cze
dc.type	master thesis	eng
dc.contributor.referee	Somol Petr
theses.degree.grantor	katedra matematiky	cze
theses.degree.programme	Aplikované matematicko-stochastické metody	cze

Soubory tohoto záznamu

Název:: F4-DP-2022-posudek-Smidl_Vaclav.pdf
Velikost:: 38.12Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F4-DP-2022-posudek-Somol_Petr.pdf
Velikost:: 71.45Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F4-DP-2022-Maskova-Michaela-dp ...
Velikost:: 2.676Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Diplomové práce - 14101 [152]

Zobrazit minimální záznam