Zobrazit minimální záznam

Semisupervised learning of heterogenous structured data



dc.contributor.advisorŠmídl Václav
dc.contributor.authorMichaela Mašková
dc.date.accessioned2022-06-08T11:51:40Z
dc.date.available2022-06-08T11:51:40Z
dc.date.issued2022-05-26
dc.identifierKOS-1195815860205
dc.identifier.urihttp://hdl.handle.net/10467/101369
dc.description.abstractSemi-supervised metody se snaží vyřešit problém dostupnosti výstupů pro data v aplikacích strojového učení. Modely jsou navrženy tak, aby se učily z dat se známou i neznámou třídou současně, a to s využitím metrického učení, generativního modelování a samoučení. Modely jsou aplikovány na standardní formáty dat, jako jsou vektory, obrázky nebo text. Tato práce rozšiřuje a zkoumá zavedené metody pro složitější datové struktury, jako jsou skupinová data a JSON soubory, pomocí nového balíčku HMill. Navržené modely jsou vyhodnoceny na třech různých datových sadách z domén víceinstančního učení, shluků bodů a kybernetické bezpečnosti. Vylepšené semi-supervised modely vykazují slibné zlepšení oproti standardním metodám učení s učitelem, ale generativní semi-supervised modely nedosahují dostatečně dobrých výsledků a vyžadují další prozkoumání.cze
dc.description.abstractSemi-supervised learning tries to solve the problem of label availability for data in machine learning applications. Models are designed to learn from labeled and unlabeled data simultaneously, with the use of metric learning, generative modeling, and self-training, and applied to standard data formats such as vectors, images, or text. This thesis extends and explores established methods for more complex data structures such as group data and JSON files, with the help of a novel HMill framework. The models designed are evaluated on three distinct datasets from the domains of multi-instance learning, point clouds, and cybersecurity. Enhanced semi-supervised models show promising improvement over standard supervised methods, but generative semi-supervised models fail to achieve high enough performance and call for further research.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subject: shluková analýzacze
dc.subjectučení metrikcze
dc.subjectsemi-supervised učenícze
dc.subjectgenerativní modelycze
dc.subject: clusteringeng
dc.subjectmetric learningeng
dc.subjectsemi-supervised learningeng
dc.subjectgenerative modelseng
dc.titleOdhad modelu nekompletních heterogenních strukturovaných datcze
dc.titleSemisupervised learning of heterogenous structured dataeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeSomol Petr
theses.degree.grantorkatedra matematikycze
theses.degree.programmeAplikované matematicko-stochastické metodycze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam