Navrh detekce anomalií pro obchodování na burze
Design of anomaly detection for stock market trading
Type of document
bakalářská prácebachelor thesis
Author
Karpenko Aleksandr
Supervisor
Kopp Martin
Opponent
Jusko Jan
Field of study
Computer ScienceStudy program
Informatics (in English)Institutions assigning rank
katedra teoretické informatikyDefended
2018-06-18Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Detekce anomálií v datech z akciových trhů v reálném čase je skutečně náročná úloha. Tato práce představuje první veřejný výzkum v této oblasti, který se nezaměřuje na cenu akcií. Nástroj pro konverzi záznamů obchodních dat ve FIX formátu do CSV formátu, vhodného pro další analýzu, byl vytvořen a použit v průběhu výzkumu. Příznaky jsou extrahovány z dat, analyzovány a klasifikovány pomocí různých technik detekce, a porovnána kvalita jednotlivých modelů. Na základě tohoto měření je vybrán model, který je nejoptimalnější vzhledem k četnostem false positive a true positive. Dále byly otestovány metody na zkrácení odezvy, které se ukázaly nepraktické, pokud jsou použity samostatně, a vyžadují ještě další zpracování. Navržený model na detekci anomálií je dostatečne přesný, že může být použit v praxi. Detection of anomalies in trading data flow in real-time is a challenging task. This thesis presents the first public research in that area, which does not focus on stock price. A tool converting FIX traffic logs into CSV format, which is suitable for analysis, is developed and used during the research. Features are extracted from the data, analyzed and classified with various anomaly detection techniques applied, and performance of different models is measured. Model which performs best in terms of false positive rate and true positive rate is proposed. Response time reduction methods are investigated and proven to be impractical when used alone and require additional post-processing. As a result, brokers can use proposed model to detect anomalies with high confidence.
Collections
- Bakalářské práce - 18101 [348]