Detekce anomálií pro množinová data
Typ dokumentu
výzkumná zprávaresearch report
Autor
Mašková, Michaela
Metadata
Zobrazit celý záznamAbstrakt
Detekce anomálií na vektorech je již dobře zmapovanou oblastí, detekce anomálií pro množinová data však představuje několik nových problémů. Množinou rozumíme skupinu vektorů, jejichž počet se v množinách se může lišit a na pořadí vektorů nezáleží. V detekci anomálií na množinových datech je tak třeba řešit invarianci na permutace a kardinalitu množin. Je nutné přehodnotit již existující techniky, modifikovat výpočty skóre a hledat nové modely. Práce se soustředí na různé aspekty problému detekce anomálií na množinách a porovnává již zavedené modely na veřejně přístupných datech. Provedená studie zdůrazňuje důležitost funkce pro výpočet skóre, která je normalizovaná a bere v potaz distribuci kardinality množin. VAE trénovaný na instancích s modifikovaným výpočtem skóre se ukazuje jako nejlepší model na MI datasetech, nově vytvořený PoolModel pak dosahuje nejlepšího výsledku na MNIST datasetu.