Bayesovské odhadování pro adaptivní dynamické rozhodování
Bayesian estimation for adaptive dynamic decision making
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Jurij Ružejnikov
Vedoucí práce
Gaj Taťjana
Oponent práce
Príbeli Peter
Studijní obor
Matematické inženýrstvíStudijní program
Aplikace přírodních vědInstituce přidělující hodnost
katedra matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
V této práci vytvoříme algoritmus, který je schopen se chovat optimálně, vůči nějakému předem zadanému cíli. K tomu je třeba model systému, který je odhadnut pomocí bayesovkého odhadování, jehož hlavní výhodou je možnost aktualizace pravděpodobnostního modelu na základě nových dat. Pro řešení problému rozhodování jsme zvolili jednokrokovou iteraci hodnot stavů, která využívá odhadnutý model a poskytuje předpis pro volbu optimální akce. Navržené řešení bylo odhadnuto na simulovaných datech odrážejících problém online aukce v reálném čase. In this thesis, we create an algorithm that is able to behave optimally in respect to a predetermined goal. This requires a system model, which is learned via bayesian estimation, whose main advantage is the possibility of updating the probabilistic model based on new data. To solve the decision-making problem, we chose one-step value iteration, which uses the learned model to provide optimal action. The proposed approach was veriťied on simulated data describing real-time bidding problem.
Kolekce
- Bakalářské práce - 14101 [278]