Aproximace konvexních funkcí v algoritmech pro řešení stochastických her
Approximation of Bound Functions in Algorithms for Solving Stochastic Games
dc.contributor.advisor | Bošanský Branislav | |
dc.contributor.author | Jaroslav Šafář | |
dc.date.accessioned | 2019-06-11T14:46:31Z | |
dc.date.available | 2019-06-11T14:46:31Z | |
dc.date.issued | 2019-06-05 | |
dc.identifier | KOS-782890268505 | |
dc.identifier.uri | http://hdl.handle.net/10467/82482 | |
dc.description.abstract | V této práci se soustředíme na aproximaci konvexních funkcí v Heuristic Search Value Iteration algoritmu pro řešení Jednostranně Částečně Pozorovatelných Stochastických Her. Jedná se o dynamické hry, kde první hráč má neúplnou informaci o hře, zatímco druhý hráč má informaci úplnou. Konvexní funkce tvoří odhady tzv. value funkce celé hry. Dolní odhad je tvořen pomocí horní obálky lineárních funkcí, zatímco horní odhad je tvořen jako dolní konvexní obálka množiny bodů. V práci se zaměřujeme pouze na aproximaci horního odhadu převážně pomocí Aproximativního Convex Hull algoritmu. Ukazujeme, že aproximace horního odhadu je problematická a že pro lepší výsledky je zapotřebí se zaměřit také na aproximaci dolního odhadu. | cze |
dc.description.abstract | In this thesis, we focus on the approximation of the bound functions in the Heuristic Search Value Iteration (HSVI) algorithm for One-Sided Partially Observable Stochastic Games (OS-POSG). These are dynamic games with infinite horizon where only one player has imperfect information, and the opponent has full information. The bound functions approximate the value function of the game. The lower bound is represented as an upper envelope of linear functions, while the upper bound is represented as a lower convex envelope of a set of points. We focus only on the approximation of the upper bound mainly by using the Approximate Convex Hull algorithm. We show that the approximation of the upper bound is problematic and that for better results, it is necessary to focus on the approximation of the lower bound function as well. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | Teorie her | cze |
dc.subject | Jednostranně Částečně Pozorovatelné Stochastické Hry | cze |
dc.subject | Markovovy Rozhodovací Procesy | cze |
dc.subject | Částečně Pozorovatelné Markovovy Rozhodovací Procesy | cze |
dc.subject | Heuristic Search Value Iteration algoritmus | cze |
dc.subject | Konvexní obal | cze |
dc.subject | Aproximativní konvexní obal | cze |
dc.subject | Game Theory | eng |
dc.subject | One-Sided Partially Observable Stochastic Games | eng |
dc.subject | Markov Decision Processes | eng |
dc.subject | Partially Observable Markov Decision Processes | eng |
dc.subject | Heuristic Search Value Iteration algorithm | eng |
dc.subject | Convex hull | eng |
dc.subject | Approximate convex hull | eng |
dc.title | Aproximace konvexních funkcí v algoritmech pro řešení stochastických her | cze |
dc.title | Approximation of Bound Functions in Algorithms for Solving Stochastic Games | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Kléma Jiří | |
theses.degree.discipline | Informatika a počítačové vědy | cze |
theses.degree.grantor | katedra kybernetiky | cze |
theses.degree.programme | Otevřená informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 13133 [714]