Klasifikace časových řad v Julia
Time Series Classification in Julia
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Antonín Kříž
Vedoucí práce
Kalvoda Tomáš
Oponent práce
Novák Petr
Studijní obor
Znalostní inženýrstvíStudijní program
Informatika 2009Instituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Klasifikace časových řad je komplexní poblém v oboru strojového učení. Moderní metody řešící tento problém jsou náročné na výkon a jejich efektivní implementace je důležitější než kdy dřív. Tato práce se zabývá analýzou metod pro klasifikaci časových řad a i efektivně implementuje metody MINIROCKET a k-Nejbližších Sousedů s Dynamic Time Warping. V rámci této práce je navrženo a implementováno několik různých optimalizací těchto algoritmů v porovnání s jejich implementací v Python balíčku sktime. Mezi tyto optimalizace, které jsou podrobně popsány, patří redukce nutných alokací paměti, paralelizace a vektorizace výpočtů a redukce nutných kroků algoritmu pro dosažení výsledku. Výkonnost této implementace je experimentálně ověřena na 113 datasetech z archivu časových řad Kalifornské univerzity v Riverside, kdy dosahuje až 17krát vyššího výkonu než tytéž algoritmy v balíčku sktime. Time series classification is a complex problem in the field of machine learning. Modern methods addressing this problem are demanding in performance and their efficient implementation is more important than ever. This paper analyzes methods for time series classification and also efficiently implements the MINIROCKET and k-Nearest Neighbors methods with Dynamic Time Warping}. In this work, several different optimizations of these algorithms are proposed and implemented against their implementation in the Python package sktime. These optimizations, which are described in detail, include reducing the necessary memory allocations, parallelization and vectorization of the computations, and reducing the necessary algorithm steps to achieve the result. The performance of this implementation is experimentally verified on 113 datasets from the University of California, Riverside time series archive, achieving up to 17 times better performance than the same algorithms in the sktime package.
Kolekce
- Bakalářské práce - 18105 [244]