Optimalization of distances for multi-instance clustering

dc.contributor.advisor Pevný, Tomáš
dc.contributor.author Dědič, Marek
dc.contributor.referee Drchal, Jan
dc.date.accepted 2020-02-05
dc.date.accessioned 2026-01-19T17:35:58Z
dc.date.issued 2020-01-07
dc.description.abstract Klastrová analýza je jedním z typických problémů náležících do skupiny algoritmů učení bez učitele. Jednou z hlavních voleb při návrhu jakéhokoliv klastrovacího algoritmu je výběr správné vzdálenostní funkce. V této práci je představen přístup k výběru vzdálenostní fuknce pomocí strojového učení. Tento přístup staví na multi-instančním učení, přístupu nabízejícím vysoký výpočetní výkon a velkou expresivní sílu pro popis dat s vnitřní strukturou pomocí hierarchických modelů. Tři metody stavěné na multi-instančním učení jsou představeny spolu s předchozími pracemi, na kterých staví. Jedna z metod spadá do skupiny algoritmů učení bez učitele zatímco dvě metody spadají do skupiny algoritmů učení s učitelem. Metody jsou teoreticky popsány a experimentálně vyhodnoceny na veřejně dostupných data- setech pro multi-instanční učení a na korporátním datasetu dat z oblasti sítové bezpečnosti. Výsledky jsou následně zhodnoceny a metody porovnány. cs
dc.description.abstract Clustering is a prime example of a problem typically associated with unsupervised learning. One of the key design choices when using any clustering algorithm is to choose the right distance metric. In this work, an approach for using machine learning to learn the metric is introduced. The approach build on multi-instance learning, an approach oering high computational performance and a strong expressive power for describing data with an inherent structure using hierarchical models. Three methods building on multi-instance learning are presented together with the prior art they build upon. One of the methods is unsupervised while two are supervised. The methods are theoretically discussed and experimentally evaluated on publicly available datasets for multi-instance learning, as well as a corporate dataset of network security data. The results are then discussed and the methods compared. en
dc.identifier KOS-878589101005
dc.identifier.uri https://hdl.handle.net/10467/177309
dc.language.iso eng
dc.publisher České vysoké učení technické v Praze cs
dc.publisher Czech Technical University in Prague en
dc.rights Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. cs
dc.rights A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. en
dc.subject strojové učení cs
dc.subject multi-instanční učení cs
dc.subject shluková analýza cs
dc.subject contractive predictive coding cs
dc.subject triplet loss cs
dc.subject manet loss cs
dc.subject neuronové sítě cs
dc.subject vícevrstvý perceptron cs
dc.subject machine learning en
dc.subject multi-instance learning en
dc.subject clustering en
dc.subject contrastive predictive coding en
dc.subject triplet en
dc.title Optimalizace vzdálenosti pro multi-instanční shlukovací problémy cs
dc.title Optimalization of distances for multi-instance clustering en
dc.type master thesis en
dspace.entity.type Publication
relation.isAdvisorOfPublication 4e6c152f-6f07-4113-8108-93a4b87d3338
relation.isAdvisorOfPublication.latestForDiscovery 4e6c152f-6f07-4113-8108-93a4b87d3338
relation.isAuthorOfPublication d21309d4-ccfe-4502-8299-2140ae4080f8
relation.isAuthorOfPublication.latestForDiscovery d21309d4-ccfe-4502-8299-2140ae4080f8
relation.isRefereeOfPublication 056b7990-7f9a-428c-8f8d-226aa0397f07
relation.isRefereeOfPublication.latestForDiscovery 056b7990-7f9a-428c-8f8d-226aa0397f07
theses.degree.grantor katedra matematiky cs
theses.degree.programme Aplikace přírodních věd cs

Files

Original bundle

Now showing 1 - 4 of 4
Name:
F4-DP-2021-Dedic-Marek-dp_minf_20_dedic.pdf
Size:
3.14 MB
Format:
Adobe Portable Document Format
Description:
THESIS
Access level:
OPEN
Access rights:
openly accessible
Name:
Dp_minf_20_dedic_p1.pdf
Size:
81.18 KB
Format:
Adobe Portable Document Format
Description:
REVIEW
Access level:
OPEN
Access rights:
openly accessible
Name:
Dp_minf_20_dedic_p2.pdf
Size:
224.17 KB
Format:
Adobe Portable Document Format
Description:
REVIEW
Access level:
OPEN
Access rights:
openly accessible
Name:
Prubeh-obhajoby.pdf
Size:
613.92 KB
Format:
Adobe Portable Document Format
Description:
DEFENSE_PROCEEDINGS
Access level:
OPEN
Access rights:
openly accessible