Aplikovatelný adaptivní diskontovaný plně pravděpodobnostní návrh rozhodovací strategie
Applicable Adaptive Discounted Fully Probabilistic Design of Decision Strategy
Type of document
diplomová prácemaster thesis
Author
Soňa Molnárová
Supervisor
Kárný Miroslav
Opponent
Kracík Jan
Study program
Aplikované matematicko-stochastické metodyInstitutions assigning rank
katedra matematikyDefended
2024-06-03Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Práca sa zaoberá problematikou nižšej uplatniteľnosti budúcich výnosov, inak nazývanej diskontovanie, pri využití plne pravdepodobnostného návrhu rozhodovacej stratégie (PPN). PPN získava optimálnu stratégiu pre riešenie rozhodovacích úloh iba prostredníctvom pravdepodobnostných distribúcií, v čom spočíva jeho hlavná výhoda. Štandardne sa rozhodovacie úlohy riešia pomocou Markovských rozhodovacích procesov (MRP), ktoré PPN taktiež zahŕňa. Postupy riešenia diskontovaných MRP už navrhnuté boli. PPN má však výhodu pri riešení úloh s neznámym modelom systému. Vďaka svojej pravdepodobnostnej podstate totiž PPN získava presnejšie odhady tohto modelu. Po predchádzajúcom rozšírení PPN o diskontovanie a odhadovanie modelu systému sa táto práca zameriava na preskúmanie vplyvu diskontovania na rozhodovacie procesy a jeho možné výhody v úlohách s neznámymi modelmi systému. The thesis addresses the issue of decreased utility of future rewards, referred to as discounting, while utilizing fully probabilistic design (FPD) of decision strategies. FPD obtains the optimal strategy for decision tasks using only probability distributions, which is its main asset. The standard way of solving decision tasks is provided by Markov decision processes (MDP), which FPD covers as a special case. Methods of solving discounted MDPs have already been introduced. However, the use of FPD might be advantageous when solving tasks with an unknown system model. Due to its probabilistic nature, FPD is able to obtain a more precise estimation of this model. After previously introducing discounting and system model estimation to FPD, the thesis now examines the effect of discounting on decision processes and its possible advantages when dealing with an unknown system model.
Collections
- Diplomové práce - 14101 [152]