Anomaly detection using Extended Isolation Forest

Detekce anomalií pomocí Extended Isolation Forest algoritmu

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Research Projects

Organizational Units

Journal Issue

Abstract

Práce se zabývá různými typy algoritmů pro detekci anomálií, podrobně pak algoritmem Extended Isolation Forest. Extended Isolation Forest rozšiřuje svého předchůdce Isolation Forest. Původní Isolation Forest přináší zcela nový přístup k detekci, ale trpí zaujetím (bias) plynoucím ze způsobu, jakým vytváří stromy. Rozšířená verze algoritmu se tohoto zaujetí zbavuje úpravou větvení a původní algoritmus je jeho speciálním případem. Extended Isolation Forest je v rámci práce implementován do H2O-3 Machine Learning open-source platformy pro strojové učení. Základním požadavkem implementace je schopnost jejího spuštění na systému s distribuovaným výpočtem pomocí Map/Reduce knihovny.

The thesis deals with anomaly detection algorithms with a focus on the Extended Isolation Forest algorithm. Extended Isolation Forest generalizes its predecessor algorithm, the Isolation Forest. The original Isolation Forest algorithm brings a brand new form of detection, although the algorithm suffers from bias coming from tree branching. Extension of the algorithm removes the bias by adjusting the branching, and the original algorithm becomes just a special case. Extended Isolation Forest is implemented into the H2O-3 Machine Learning open-source platform. Implementation is required to run on a distributed computing system with a Map/Reduce library.

Description

Citation

Endorsement

Review

Supplemented By

Referenced By