Aplikovatelný adaptivní diskontovaný plně pravděpodobnostní návrh rozhodovací strategie

Soňa Molnárová

Applicable Adaptive Discounted Fully Probabilistic Design of Decision Strategy

Type of document

diplomová práce
master thesis

Author

Soňa Molnárová

Supervisor

Kárný Miroslav

Opponent

Kracík Jan

Study program

Aplikované matematicko-stochastické metody

Institutions assigning rank

katedra matematiky

Defended

2024-06-03

Rights

A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html

Metadata

Show full item record

Abstract

Práca sa zaoberá problematikou nižšej uplatniteľnosti budúcich výnosov, inak nazývanej diskontovanie, pri využití plne pravdepodobnostného návrhu rozhodovacej stratégie (PPN). PPN získava optimálnu stratégiu pre riešenie rozhodovacích úloh iba prostredníctvom pravdepodobnostných distribúcií, v čom spočíva jeho hlavná výhoda. Štandardne sa rozhodovacie úlohy riešia pomocou Markovských rozhodovacích procesov (MRP), ktoré PPN taktiež zahŕňa. Postupy riešenia diskontovaných MRP už navrhnuté boli. PPN má však výhodu pri riešení úloh s neznámym modelom systému. Vďaka svojej pravdepodobnostnej podstate totiž PPN získava presnejšie odhady tohto modelu. Po predchádzajúcom rozšírení PPN o diskontovanie a odhadovanie modelu systému sa táto práca zameriava na preskúmanie vplyvu diskontovania na rozhodovacie procesy a jeho možné výhody v úlohách s neznámymi modelmi systému.

The thesis addresses the issue of decreased utility of future rewards, referred to as discounting, while utilizing fully probabilistic design (FPD) of decision strategies. FPD obtains the optimal strategy for decision tasks using only probability distributions, which is its main asset. The standard way of solving decision tasks is provided by Markov decision processes (MDP), which FPD covers as a special case. Methods of solving discounted MDPs have already been introduced. However, the use of FPD might be advantageous when solving tasks with an unknown system model. Due to its probabilistic nature, FPD is able to obtain a more precise estimation of this model. After previously introducing discounting and system model estimation to FPD, the thesis now examines the effect of discounting on decision processes and its possible advantages when dealing with an unknown system model.