Hybridní diskriminativně-generativní modely pro množinová data

Jakub Bureš

Hybrid Discriminative-Generative Training for Set Data

Typ dokumentu

diplomová práce
master thesis

Autor

Jakub Bureš

Vedoucí práce

Šmídl Václav

Oponent práce

Najman Michal

Studijní program

Aplikované matematicko-stochastické metody

Instituce přidělující hodnost

katedra matematiky

Práva

A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html

Metadata

Zobrazit celý záznam

Abstrakt

Tato diplomová práce se zabývá hybridními diskriminativními a generativními modely a jejich možným využitím v multi-instačním učení, kde je jeden vzorek tvořen množinou vektorů. Doposud byly tyto modely trénovány pouze diskriminativně. Ukazuje se však, že samotný diskriminativní přístup může mít svoje limity a přidáním generativní složky je možno tyto limity posunovat. Způsobů, jak zahrnout generativní složku do tréninku modelu, je vícero. My se zaměříme na dva, jeden pomocí kontrastivního učení a druhý na bázi variačního autoencoderu. Pilířem práce s množinovými daty je pak struktura HMill s knihovnou Mill.jl, implementována v programovacím jazyku Julia, která dovoluje jednoduše a efektivně trénovat modely na těchto datech. My se ji pokusíme rozšířit o generativní složku..

This Master's Thesis deals with hybrid discriminative and generative models and their possible use in multi-instance learning, where one sample consists of a set of vectors. So far, these models have only been trained discriminatively. However, it turns out that the discriminative approach alone can have downsides, and by adding a generative component, these downsides can be minimized. There are several ways to include a generative component in model training. We focus on two, one using contrastive learning and the other based on a variational autoencoder. The mainstay of working with set data is then the HMill framework with the Mill.jl library, implemented in the Julia programming language, which allows us to train models on these data simply and efficiently. We will try to extend it with a generative component.