Využití metody regularizace odměn ve hrách s neúplnou informací
Leveraging Reward Regularization in Imperfect Information Games
dc.contributor.advisor | Kubíček Ondřej | |
dc.contributor.author | Tomáš Holeček | |
dc.date.accessioned | 2024-06-18T14:22:33Z | |
dc.date.available | 2024-06-18T14:22:33Z | |
dc.date.issued | 2024-06-06 | |
dc.identifier | KOS-1240524539805 | |
dc.identifier.uri | http://hdl.handle.net/10467/115266 | |
dc.description.abstract | Regularizace odměn se ukázala jako užitečná technika pro algoritmy posilovaného učení určené k řešení her s neúplnou informací. Jeden takový algoritmus používající tuto techniku je nedávno vyvinutý algoritmus Regularizovaná Nashova Dynamika (RNaD), který dosáhl výsledku na úrovní expertních hráčů ve hře Stratego. Studie těchto technik se zatím ale zaměřovala na dvouhráčové hry s nulovým součtem a není zřejmé, jestli tyto techniky budou užitečné i v širší skupině her jako jsou vícehráčové hry či hry bez nulového součtu. Proto je cílem práce najít obecněji použitelné rozšíření těchto technik a použít ho k upravení již existujících algorithmů pro použití v novém typu her. Efektivnost těchto úprav je ukázána na několika experimentech provedených na hrách typu pronásledování-únik. | cze |
dc.description.abstract | Reward regularization proved to be a powerful technique in reinforcement learning algorithms for solving imperfect information games. One such algorithm using this technique is the recently developed Regularized Nash Dynamics (RNaD), which achieved a human-expert level performance in the game Stratego. However, research about this technique has focused on two-player zero-sum games, and it is currently unknown if this technique proves useful even in a broader class of games like general-sum or multiplayer games. Hence, this work aims to devise a more generally applicable extension of these techniques and modify the developed algorithms into a new class of games. The effectiveness of these modifications is shown in several experiments on pursuit-evasion games. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | hry s neúplnou informací | cze |
dc.subject | hry bez nulového součtu | cze |
dc.subject | vícehráčové hry | cze |
dc.subject | posilované učení | cze |
dc.subject | hry pronásledování-únik | cze |
dc.subject | regularizace odměn | cze |
dc.subject | Nashovo ekvilibrium | cze |
dc.subject | Regularizovaná Nashova dynamika | cze |
dc.subject | imperfect information games | eng |
dc.subject | general-sum games | eng |
dc.subject | multiplayer games | eng |
dc.subject | reinforcement learning | eng |
dc.subject | pursuit-evasion games | eng |
dc.subject | reward regularization | eng |
dc.subject | Nash equilibrium | eng |
dc.subject | Regularized Nash Dynamics | eng |
dc.title | Využití metody regularizace odměn ve hrách s neúplnou informací | cze |
dc.title | Leveraging Reward Regularization in Imperfect Information Games | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Grus Josef | |
theses.degree.discipline | Počítačové hry a grafika | cze |
theses.degree.grantor | katedra počítačové grafiky a interakce | cze |
theses.degree.programme | Otevřená informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 13139 [432]