Framework využívající velké jazykové modely pro předpověď fotbalových událostí
A Large Language Models Framework for Football Event Prediction
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Dmytro Borovko
Vedoucí práce
Da Silva Alves Rodrigo Augusto
Oponent práce
Čepek Miroslav
Studijní obor
Umělá inteligence 2021Studijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato bakalářská práce představuje framework pro predikci následující události ve fotbalových zápasech pomocí velkých jazykových modelů (LLM), které integrují sémantické embeddingy z nestrukturovaných textových komentářů se strukturovanými záznamy událostí. Výzkum zkoumá, zda embeddingy odvozené z LLM mohou zlepšit přesnost predikce ve srovnání s tradičními sekvenčními modely, které se spoléhají výhradně na tabulková data. Metodologie zahrnuje získávání a předzpracování dat, extrakci embeddingů a vývoj dopředné neuronové sítě, která je hodnocena pomocí metrik, jako je přesnost a průměrná reciproční hodnota (MRR). Ačkoli modely založené na LLM nepřekonaly konvenční přístupy, navržený framework identifikuje klíčová omezení a ukazuje silný potenciál pro obohacení modelování událostí o sémantický kontext. Jeho modulární design umožňuje rozsáhlé experimentování a slouží jako reprodukovatelný referenční bod pro budoucí výzkum. Tato práce přispívá k rozvíjejícímu se propojení zpracování přirozeného jazyka a sportovní analytiky a poskytuje základ pro další vývoj v oblasti využití LLM pro lepší porozumění a predikci událostí ve fotbalových zápasech. This thesis presents a framework for predicting the next event in football matches by leveraging Large Language Models (LLMs) to integrate semantic embeddings from unstructured textual commentary with structured event logs. The research investigates whether LLM-derived embeddings can enhance prediction accuracy compared to traditional sequential models, which rely solely on tabular event data. The methodology encompasses data acquisition and preprocessing, embedding extraction, and the development of a feedforward neural network, evaluated through metrics such as accuracy and Mean Reciprocal Rank (MRR). While the LLM-based models did not outperform conventional approaches, the framework identifies key limitations and demonstrates strong potential for enriching event modeling with semantic context. Its modular design enables extensive experimentation and serves as a reproducible benchmark for future research. This work contributes to the emerging intersection of natural language processing and sports analytics, offering a foundation for further development in using LLMs to enhance understanding and prediction of football match events.
Kolekce
- Bakalářské práce - 18105 [369]