Implementation of split guiding metric for Isolation Forest

dc.contributor.advisor Valenta, Adam
dc.contributor.author Kramár, Maroš
dc.contributor.referee Vašata, Daniel
dc.date.accessioned 2023-06-09T22:52:03Z
dc.date.available 2023-06-09T22:52:03Z
dc.date.issued 2023-06-09
dc.description.abstract Detekcia anomálií je dôležitou súčasťou analýzy dát a strojového učenia so širokým spektrom využitia. V dobe, keď sa údaje spracúvajú v obrovských množstvách, môžu byť tradičné metódy výpočetne nákladné a nemusia byť dobre škálovateľné na veľkých, mnohodimenzionálnych dátových sadách. Isolation Forest je unikátny koncept, ktorý je založený na explicitnej izolácii anomálnych dátových bodov namiesto profilovania normálnych bodov. Postupom času boli objavnené niektoré obmedzenia tohto modelu a navrhnuté rozšírenia na ich odstránenie. V práci sú vybrané rozšírenia skúmané a experimentuje sa s ich kombináciou. Vybraná metóda je implementovaná do open-source platformy pre strojové učenie, H2O-3. Záver obsahuje vyhodnotenie novo pridanej implementácie, porovnanie s dvoma existujúcimi a diskusiu výsledkov. cs
dc.description.abstract Anomaly detection is an important part of data analysis and machine learning with many applications. In an era, where data is being processed in massive quantities, traditional methods can be computationally expensive and may not scale well on large, high-dimensional datasets. The Isolation Forest is a unique concept, which is based on explicitly isolating anomalous data points rather than profiling normal ones. Over time, some limitations of the model have been discovered and some extensions have been proposed to address them. The thesis studies selected extensions and experiments with combining their approaches. The selected method is implemented into the H2O-3 open-source machine learning platform. The added implementation is evaluated against two existing implementations and the results are discussed. en
dc.identifier KOS-1240469473105
dc.identifier.uri http://hdl.handle.net/10467/108884
dc.publisher České vysoké učení technické v Praze cs
dc.publisher Czech Technical University in Prague en
dc.rights A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. en
dc.rights Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. cs
dc.subject Detekcia anomálií cs
dc.subject nesupervizované učenie cs
dc.subject Isolation Forest cs
dc.subject Extended Isolation Forest cs
dc.subject Fair Cut Forest cs
dc.subject H2O.ai cs
dc.subject Anomaly detection en
dc.subject unsupervised learning en
dc.subject Isolation Forest en
dc.subject Extended Isolation Forest en
dc.subject Fair Cut Forest en
dc.subject H2O.ai en
dc.title Implementace metriky pro větvení v Isolation Forest cs
dc.title Implementation of split guiding metric for Isolation Forest en
dc.type master thesis en
dspace.entity.type Publication
relation.isAdvisorOfPublication 80560634-dfff-48ed-89a2-da36aa99cfcf
relation.isAdvisorOfPublication.latestForDiscovery 80560634-dfff-48ed-89a2-da36aa99cfcf
relation.isAuthorOfPublication 59752f29-b0e2-41ab-969a-e91722b6d358
relation.isAuthorOfPublication.latestForDiscovery 59752f29-b0e2-41ab-969a-e91722b6d358
relation.isRefereeOfPublication b096ba13-266b-4af5-843a-28cf1ea6fc0e
relation.isRefereeOfPublication.latestForDiscovery b096ba13-266b-4af5-843a-28cf1ea6fc0e
theses.degree.discipline Znalostní inženýrství cs
theses.degree.grantor katedra aplikované matematiky cs
theses.degree.programme Informatika cs

Files

Original bundle

Now showing 1 - 3 of 3
Name:
F8-DP-2023-Kramar-Maros-thesis.pdf
Size:
2.86 MB
Format:
Adobe Portable Document Format
Description:
PLNY_TEXT
Name:
F8-DP-2023-posudek-Valenta_Adam.pdf
Size:
53.31 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK
Name:
F8-DP-2023-posudek-Vasata_Daniel.pdf
Size:
45.52 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK