Analýza dat o lavinách a bezpečnost skialpinismu
Analysis of Avalanche Data and Ski Touring Safety
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Matyáš Thér
Vedoucí práce
Vitvar Tomáš
Oponent práce
Hrabáková Jitka
Studijní obor
Znalostní inženýrstvíStudijní program
Informatika, platnost do 2024Instituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Práce se zaměřuje na získání dat o historických lavinových událostech na území rakouské spolkové země Tyrolsko, jejich předzpracování a doplnění o meteorologická data za účelem vytvoření datové sady. Získaná data o lavinových incidentech jsou analyzována a porovnána s lavinovými předpovědmi zveřejněnými LWD Tirol. Za účelem predikce lavinového nebezpečí je provedena klasifikace pomocí vybraných tradičních metod (náhodný les, gradient boosting, SVM a logistická regrese). Z důvodu nevyvážené distribuce tříd vysvětlované proměnné je pro trénování modelů využit náhodný a ADASYN oversampling. Při predikci na testovací množině je dosaženo hodnoty 0,74 pro vážené F1 skóre u modelu náhodného lesa natrénovaného na trénovací množině s náhodným oversamplingem. Hlavním výstupem práce je veřejně dostupný repozitář na portálu GitHub s předzpracovanou datovou sadou a postupem analýzy uloženým v souborech ve formátu Jupyter Notebook, které umožňují replikaci postupu a další analýzu získaných dat. The work focuses on the acquisition of data on historical avalanche events in the Austrian federal state of Tyrol, their preprocessing and supplementation with meteorological data in order to create a dataset. The obtained avalanche incident data are analysed and compared with avalanche bulletins published by LWD Tirol. In order to predict the avalanche danger rating, classification is performed using selected traditional methods (random forest, gradient boosting, SVM and logistic regression). Due to the imbalanced distribution of the classes of the target variable, random and ADASYN oversampling is used to train the models. A value of 0.74 is achieved for the weighted F1 score for the random forest model trained on the training set with random oversampling. The main output of the work is a publicly available repository on GitHub with a preprocessed dataset and analysis procedure in Jupyter Notebook format, which allows replication of the procedure and further analysis of the data obtained.
Kolekce
- Bakalářské práce - 18105 [300]