Využití metody regularizace odměn ve hrách s neúplnou informací

Tomáš Holeček

Leveraging Reward Regularization in Imperfect Information Games

dc.contributor.advisor	Kubíček Ondřej
dc.contributor.author	Tomáš Holeček
dc.date.accessioned	2024-06-18T14:22:33Z
dc.date.available	2024-06-18T14:22:33Z
dc.date.issued	2024-06-06
dc.identifier	KOS-1240524539805
dc.identifier.uri	http://hdl.handle.net/10467/115266
dc.description.abstract	Regularizace odměn se ukázala jako užitečná technika pro algoritmy posilovaného učení určené k řešení her s neúplnou informací. Jeden takový algoritmus používající tuto techniku je nedávno vyvinutý algoritmus Regularizovaná Nashova Dynamika (RNaD), který dosáhl výsledku na úrovní expertních hráčů ve hře Stratego. Studie těchto technik se zatím ale zaměřovala na dvouhráčové hry s nulovým součtem a není zřejmé, jestli tyto techniky budou užitečné i v širší skupině her jako jsou vícehráčové hry či hry bez nulového součtu. Proto je cílem práce najít obecněji použitelné rozšíření těchto technik a použít ho k upravení již existujících algorithmů pro použití v novém typu her. Efektivnost těchto úprav je ukázána na několika experimentech provedených na hrách typu pronásledování-únik.	cze
dc.description.abstract	Reward regularization proved to be a powerful technique in reinforcement learning algorithms for solving imperfect information games. One such algorithm using this technique is the recently developed Regularized Nash Dynamics (RNaD), which achieved a human-expert level performance in the game Stratego. However, research about this technique has focused on two-player zero-sum games, and it is currently unknown if this technique proves useful even in a broader class of games like general-sum or multiplayer games. Hence, this work aims to devise a more generally applicable extension of these techniques and modify the developed algorithms into a new class of games. The effectiveness of these modifications is shown in several experiments on pursuit-evasion games.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	hry s neúplnou informací	cze
dc.subject	hry bez nulového součtu	cze
dc.subject	vícehráčové hry	cze
dc.subject	posilované učení	cze
dc.subject	hry pronásledování-únik	cze
dc.subject	regularizace odměn	cze
dc.subject	Nashovo ekvilibrium	cze
dc.subject	Regularizovaná Nashova dynamika	cze
dc.subject	imperfect information games	eng
dc.subject	general-sum games	eng
dc.subject	multiplayer games	eng
dc.subject	reinforcement learning	eng
dc.subject	pursuit-evasion games	eng
dc.subject	reward regularization	eng
dc.subject	Nash equilibrium	eng
dc.subject	Regularized Nash Dynamics	eng
dc.title	Využití metody regularizace odměn ve hrách s neúplnou informací	cze
dc.title	Leveraging Reward Regularization in Imperfect Information Games	eng
dc.type	bakalářská práce	cze
dc.type	bachelor thesis	eng
dc.contributor.referee	Grus Josef
theses.degree.discipline	Počítačové hry a grafika	cze
theses.degree.grantor	katedra počítačové grafiky a interakce	cze
theses.degree.programme	Otevřená informatika	cze

Soubory tohoto záznamu

Název:: F3-BP-2024-Holecek-Tomas-Leveraging ...
Velikost:: 1.647Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F3-BP-2024-Holecek-Tomas-prilo ...
Velikost:: 99.03Kb
Formát:: Neznámý
Popis:: PRILOHA
: Zobrazit/otevřít

Název:: F3-BP-2024-posudek-Kubicek_Ond ...
Velikost:: 162.1Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F3-BP-2024-posudek-Grus_Josef.pdf
Velikost:: 119.6Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Bakalářské práce - 13139 [432]

Zobrazit minimální záznam