Použití Model Stacking pro predikci zpoždění letů na základě historických dat
Flight Delay Prediction based on Model Stacking
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Artur Farrakhov
Vedoucí práce
Smítková Janků Ladislava
Oponent práce
Vašata Daniel
Studijní obor
Umělá inteligence 2021Studijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyObhájeno
2025-06-23Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato bakalářská práce se zabývá predikcí zpoždění letů pomocí pokročilých metod strojového učení, konkrétně metodou Model Stacking. Cílem je analyzovat vliv historických a meteorologických faktorů na přesnost predikce a navrhnout ensemble přístup, který kombinuje výstupy různých modelů za účelem zvýšení robustnosti a generalizační schopnosti. V rámci práce je vytvořen rozsáhlý dataset pro rok 2015 kombinující data o letech z Bureau of Transportation Statistics a meteorologické údaje z NOAA. Testují se modely jako lineární regrese, Random Forest, XGBoost a vícevrstvý perceptron, jejichž Out-of-Fold predikce slouží jako vstupy pro trénování meta-modelu založeného na lineární regresi. Výsledný ensemble model dosahuje nejlepšího výkonu s hodnotou RMSE = 7,97 minut, čímž překonává všechny jednotlivé modely. Práce potvrzuje efektivitu metody Model Stacking pro predikci zpoždění letů, diskutuje dopady meteorologických jevů na provoz letecké dopravy a naznačuje možnosti dalšího rozvoje. This bachelor thesis deals with flight delay prediction using advanced machine learning methods, specifically the Model Stacking technique. The aim is to analyze the impact of historical and meteorological factors on prediction accuracy and to design an ensemble approach that combines outputs from various models to improve robustness and generalization ability. A large dataset for the year 2015 is created, combining flight data from the Bureau of Transportation Statistics and meteorological data from NOAA. Models such as Linear Regression, Random Forest, XGBoost, and Multilayer Perceptron are tested. Their Out-of-Fold predictions serve as inputs for training a meta-model based on linear regression. The final ensemble model achieves the best performance with RMSE = 7.97 minutes, outperforming all individual models. The work confirms the effectiveness of Model Stacking for flight delay prediction, discusses the impact of meteorological phenomena on air traffic operations, and suggests possibilities for further development.
Kolekce
- Bakalářské práce - 18105 [369]