Implementace metriky pro větvení v Isolation Forest
Implementation of split guiding metric for Isolation Forest
Typ dokumentu
diplomová prácemaster thesis
Autor
Maroš Kramár
Vedoucí práce
Valenta Adam
Oponent práce
Vašata Daniel
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Detekcia anomálií je dôležitou súčasťou analýzy dát a strojového učenia so širokým spektrom využitia. V dobe, keď sa údaje spracúvajú v obrovských množstvách, môžu byť tradičné metódy výpočetne nákladné a nemusia byť dobre škálovateľné na veľkých, mnohodimenzionálnych dátových sadách. Isolation Forest je unikátny koncept, ktorý je založený na explicitnej izolácii anomálnych dátových bodov namiesto profilovania normálnych bodov. Postupom času boli objavnené niektoré obmedzenia tohto modelu a navrhnuté rozšírenia na ich odstránenie. V práci sú vybrané rozšírenia skúmané a experimentuje sa s ich kombináciou. Vybraná metóda je implementovaná do open-source platformy pre strojové učenie, H2O-3. Záver obsahuje vyhodnotenie novo pridanej implementácie, porovnanie s dvoma existujúcimi a diskusiu výsledkov. Anomaly detection is an important part of data analysis and machine learning with many applications. In an era, where data is being processed in massive quantities, traditional methods can be computationally expensive and may not scale well on large, high-dimensional datasets. The Isolation Forest is a unique concept, which is based on explicitly isolating anomalous data points rather than profiling normal ones. Over time, some limitations of the model have been discovered and some extensions have been proposed to address them. The thesis studies selected extensions and experiments with combining their approaches. The selected method is implemented into the H2O-3 open-source machine learning platform. The added implementation is evaluated against two existing implementations and the results are discussed.
Kolekce
- Diplomové práce - 18105 [195]
Související záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Zdokonalení metod znalostního inženýrství používaných pro včasnou detekci říje u skotu
Autor: Veselý David; Vedoucí práce: Holeňa Martin; Oponent práce: Borovička Tomáš
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2015-06-08)Tato práce se zabývá výzkumem včasné detekce říje krav na moderních automatizovaných farmách. Jejím cílem je porovnat vybrané techniky znalostního inženýrství s referenčním řešením. Mezi zkoumané techniky patří především: ... -
Predikce kardiální autonomní neuropatie u pacientů s diabetem
Autor: Benešová Michaela; Vedoucí práce: Novák Jakub; Oponent práce: Lhotská Lenka
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-05-17)Prace se zabyva analyzou medicnskych dat, jejich predzpracovanm a konstrukc -
Predikce kriminality
Autor: Maurerová Veronika; Vedoucí práce: Kordík Pavel; Oponent práce: Hořínek Jan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2017-05-09)S důrazem na efektivitu práce a s vzrůstajícím zájmem o zpracování dat, strojové učení a umělou inteligenci, se prediktivní analýza stává součástí policejních aktivit, predevším v oblasti prevence kriminality. Například ...