Hybridní diskriminativně-generativní modely pro množinová data
Hybrid Discriminative-Generative Training for Set Data
Typ dokumentu
diplomová prácemaster thesis
Autor
Jakub Bureš
Vedoucí práce
Šmídl Václav
Oponent práce
Najman Michal
Studijní program
Aplikované matematicko-stochastické metodyInstituce přidělující hodnost
katedra matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato diplomová práce se zabývá hybridními diskriminativními a generativními modely a jejich možným využitím v multi-instačním učení, kde je jeden vzorek tvořen množinou vektorů. Doposud byly tyto modely trénovány pouze diskriminativně. Ukazuje se však, že samotný diskriminativní přístup může mít svoje limity a přidáním generativní složky je možno tyto limity posunovat. Způsobů, jak zahrnout generativní složku do tréninku modelu, je vícero. My se zaměříme na dva, jeden pomocí kontrastivního učení a druhý na bázi variačního autoencoderu. Pilířem práce s množinovými daty je pak struktura HMill s knihovnou Mill.jl, implementována v programovacím jazyku Julia, která dovoluje jednoduše a efektivně trénovat modely na těchto datech. My se ji pokusíme rozšířit o generativní složku.. This Master's Thesis deals with hybrid discriminative and generative models and their possible use in multi-instance learning, where one sample consists of a set of vectors. So far, these models have only been trained discriminatively. However, it turns out that the discriminative approach alone can have downsides, and by adding a generative component, these downsides can be minimized. There are several ways to include a generative component in model training. We focus on two, one using contrastive learning and the other based on a variational autoencoder. The mainstay of working with set data is then the HMill framework with the Mill.jl library, implemented in the Julia programming language, which allows us to train models on these data simply and efficiently. We will try to extend it with a generative component.
Kolekce
- Diplomové práce - 14101 [140]