Machine learning operations framework for predictions in sports
Framework pro provozní operace strojového učení ve sportech
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
Abstract
Tato práce se zaměřuje na vývoj komplexního softwarového frameworku pro efektivní empirické testování modelů strojového učení v prediktivní sportovní analytice. Cílem práce je poskytnout možnost provádět sledovatelné, reprodukovatelné, modulární a efektivní experimenty dodržující zásady MLOps a vylepšit současný systém pro predikci výsledků zápasů začleněním modulů určených pro optimalizaci sázek. Systém bude vyhodnocen pomocí různých modelů předpovědí a strategií optimalizace portfolia aplikovaných na různé oblasti sportovních dat. Tato práce ukáže integraci stávajících zdrojů do jediného softwarového frameworku v souladu s řešeními MLOps, vytvoření robustního protokolu pro vyhodnocování workflow, širokou škálu experimentů za různých podmínek, analýzu výsledků a případná vylepšení. Tato práce umožní dosáhnout pokroku v chápání a používání metod strojového učení v prediktivní sportovní analytice a zároveň zdůrazní význam efektivního experimentování a reprodukovatelnosti. Kromě toho má tato práce využít výpočetní možnosti počítačového clusteru k urychlení procesu experimentování a podrobně se zabývá praktickou implementací frameworku, včetně nezbytných softwarových požadavků na nastavení počítačového clusteru.
This thesis focuses on the development of a comprehensive software framework for efficient empirical testing of machine learning models in predictive sports analytics. The goal of the work is to provide the option to conduct trackable, reproducible, modular and efficient experiments adhering to MLOps principles, and to improve the current framework for predicting match results by incorporating blocks responsible for betting optimization. The system will be evaluated using different prediction models and portfolio optimization strategies applied to different areas of sports data. This work will demonstrate the integration of existing resources into a single software framework consistent with MLOps solutions, the creation of a robust workflow evaluation protocol, a wide range of experiments under various conditions, the analysis of results, and potential improvements. This work advances the understanding and application of machine learning methods in predictive sports analytics while emphasizing the importance of efficient experimentation and reproducibility. Furthermore, this work is to leverage the computational capabilities of a computer cluster to accelerate the experimentation process and discusses the practical implementation of the framework, including the necessary software requirements for setting up the computer cluster.
This thesis focuses on the development of a comprehensive software framework for efficient empirical testing of machine learning models in predictive sports analytics. The goal of the work is to provide the option to conduct trackable, reproducible, modular and efficient experiments adhering to MLOps principles, and to improve the current framework for predicting match results by incorporating blocks responsible for betting optimization. The system will be evaluated using different prediction models and portfolio optimization strategies applied to different areas of sports data. This work will demonstrate the integration of existing resources into a single software framework consistent with MLOps solutions, the creation of a robust workflow evaluation protocol, a wide range of experiments under various conditions, the analysis of results, and potential improvements. This work advances the understanding and application of machine learning methods in predictive sports analytics while emphasizing the importance of efficient experimentation and reproducibility. Furthermore, this work is to leverage the computational capabilities of a computer cluster to accelerate the experimentation process and discusses the practical implementation of the framework, including the necessary software requirements for setting up the computer cluster.
Description
Citation
Underlying research data set URL
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.