Modelování trendů ve vývoji populace světových zemí
Modelling trends in the population of the world's countries
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Dominik Bursa
Vedoucí práce
Novák Petr
Oponent práce
Hrabák Pavel
Studijní obor
Umělá inteligence 2021Studijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato bakalářská práce se zabývá modelováním trendů ve vývoji populace světových zemí. Práce se zaměřuje na prozkoumání a aplikaci moderních statistických metod pro modelování časových řad s důrazem na využití vysvětlujících proměnných. Teoretická část představuje základní koncepty časových řad, statistické charakteristiky, stochastické procesy a modely vhodné pro predikci populace, jako je lineární regrese, modely ARIMA a náhodné lesy. Praktická část popisuje sběr a předzpracování dat o populaci a relevantních socioekonomických ukazatelích z veřejných zdrojů. Následně jsou na těchto datech natrénovány a porovnány tři různé modely s různými přístupy, včetně řešení problematiky sezónnosti, detekce změn v trendech a detekce odlehlých hodnot. Výkonnost modelů je hodnocena pomocí metrik střední kvadratické chyby (RMSE) a střední absolutní procentuální chyby (MAPE). Na základě těchto metrik se jako nejpřesnější ukázal model ARIMAX, který dosáhl nejnižší hodnoty MAPE jak pro krátkodobou (0.0092), tak i pro dlouhodobou predikci (0.0200), čímž efektivně kombinuje časovou strukturu dat s vlivem exogenních proměnných. This bachelor's thesis focuses on modeling trends in the population development of world countries. The work explores and applies modern statistical methods for time series modeling with an emphasis on utilizing explanatory variables. The theoretical part introduces basic concepts of time series, statistical characteristics, stochastic processes, and models suitable for population prediction, such as linear regression, ARIMA models, and random forests. The practical part describes the collection and preprocessing of population data and relevant socioeconomic indicators from public sources. Subsequently, three different models with various approaches are trained and compared on this data, including addressing seasonality, change point detection, and outlier detection. Model performance is evaluated using Root Mean Square Error (RMSE) and Mean Absolute Percentage Error (MAPE) metrics. Based on these metrics, the ARIMAX model proved to be the most accurate, achieving the lowest MAPE values for both short-term (0.0092) and long-term predictions (0.0200), thus effectively combining the time structure of the data with the influence of exogenous variables.
Kolekce
- Bakalářské práce - 18105 [315]