Time Series Classification in Julia

Klasifikace časových řad v Julia

Supervisors

Reviewers

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Research Projects

Organizational Units

Journal Issue

Abstract

Klasifikace časových řad je komplexní poblém v oboru strojového učení. Moderní metody řešící tento problém jsou náročné na výkon a jejich efektivní implementace je důležitější než kdy dřív. Tato práce se zabývá analýzou metod pro klasifikaci časových řad a i efektivně implementuje metody MINIROCKET a k-Nejbližších Sousedů s Dynamic Time Warping. V rámci této práce je navrženo a implementováno několik různých optimalizací těchto algoritmů v porovnání s jejich implementací v Python balíčku sktime. Mezi tyto optimalizace, které jsou podrobně popsány, patří redukce nutných alokací paměti, paralelizace a vektorizace výpočtů a redukce nutných kroků algoritmu pro dosažení výsledku. Výkonnost této implementace je experimentálně ověřena na 113 datasetech z archivu časových řad Kalifornské univerzity v Riverside, kdy dosahuje až 17krát vyššího výkonu než tytéž algoritmy v balíčku sktime.

Time series classification is a complex problem in the field of machine learning. Modern methods addressing this problem are demanding in performance and their efficient implementation is more important than ever. This paper analyzes methods for time series classification and also efficiently implements the MINIROCKET and k-Nearest Neighbors methods with Dynamic Time Warping}. In this work, several different optimizations of these algorithms are proposed and implemented against their implementation in the Python package sktime. These optimizations, which are described in detail, include reducing the necessary memory allocations, parallelization and vectorization of the computations, and reducing the necessary algorithm steps to achieve the result. The performance of this implementation is experimentally verified on 113 datasets from the University of California, Riverside time series archive, achieving up to 17 times better performance than the same algorithms in the sktime package.

Description

Citation

Endorsement

Review

Supplemented By

Referenced By