Dynamické plně pravděpodobnostní rozhodování se zastavováním
Dynamic Fully Probabilistic Decision Making with Stopping
Typ dokumentu
diplomová prácemaster thesis
Autor
Daniel Karlík
Vedoucí práce
Kárný Miroslav
Oponent práce
Kracík Jan
Studijní program
Aplikované matematicko-stochastické metodyInstituce přidělující hodnost
katedra matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce přispívá k řešení problematiky v oblasti rozhodování, přesněji v oblasti dynamického rozhodování, kde je důležité provádět rozhodování s ohledem na čas a vývoj problému. Cílem této práce bylo navrhnout řešení jež by vedlo k získání optimálního zastavovacího pravidla. K řešení rozhodovacího procesu jsme použili teorie plně pravděpodobnostního návrhu (PPN). PPN představuje rozšíření tradiční rozhodovací metody markovských rozhodovacích procesů. PPN řeší a modeluje vývoj stavů v uzavřené rozhodovací smyčce pomocí ideální distribuce chování, která reprezentuje agentovy preference. Optimální rozhodovací pravidlo v PPN je hledáno pomocí minimalizace Kullback-Leiblerovi divergence mezi distribucí chování modelu a jejím ideálem. Metoda zjišťování preferencí v PPN slouží k převodu preferencí na ideální distribuce chování agenta. V této práci jsme navrhli rozšíření PPN o zastavování a poskytli jeho řešení. Dále jsme navrhli způsob využití zjišťování preferencí v řešení PPN se zastavováním. Nakonec jsme pomocí simulovaných experimentů a bayesovského odhadování parametrů ověřili kvalitu a rychlost námi navrženého řešení. This work contributes to the problem in the area of decision making, more specifically in the area of dynamic decision making, where it is important to make decisions with respect to time and the evolution of the problem. The aim of this work was to propose a solution that would lead to obtain an optimal stopping rule. We used the theory of Fully probabilistic design (FPD) to solve the decision making processes. FPD is an extension of the well known Markov decision processes. FPD solves and models the evolution of states in a closed decision loop using an ideal probability distribution (pd) of behavior that represents the agent's preferences. The optimal decision rule in FPD is evaluated by minimizing the Kullback-Leibler divergence between the model's pd of behavior and its ideal. The preference elicitation (PE) method in FPD is used to convert the preferences into the agent's ideal pd of behaviors. In this work, we propose an extension of FPD to incorporate stopping and provide its solution. We also proposed an approach to exploit PE in the solution of FPD with stopping. Finally, we verified the quality and speed of our proposed solution using simulated experiments and Bayesian parameter estimation.
Kolekce
- Diplomové práce - 14101 [140]