Zobrazit minimální záznam

Leveraging Reward Regularization in Imperfect Information Games



dc.contributor.advisorKubíček Ondřej
dc.contributor.authorTomáš Holeček
dc.date.accessioned2024-06-18T14:22:33Z
dc.date.available2024-06-18T14:22:33Z
dc.date.issued2024-06-06
dc.identifierKOS-1240524539805
dc.identifier.urihttp://hdl.handle.net/10467/115266
dc.description.abstractRegularizace odměn se ukázala jako užitečná technika pro algoritmy posilovaného učení určené k řešení her s neúplnou informací. Jeden takový algoritmus používající tuto techniku je nedávno vyvinutý algoritmus Regularizovaná Nashova Dynamika (RNaD), který dosáhl výsledku na úrovní expertních hráčů ve hře Stratego. Studie těchto technik se zatím ale zaměřovala na dvouhráčové hry s nulovým součtem a není zřejmé, jestli tyto techniky budou užitečné i v širší skupině her jako jsou vícehráčové hry či hry bez nulového součtu. Proto je cílem práce najít obecněji použitelné rozšíření těchto technik a použít ho k upravení již existujících algorithmů pro použití v novém typu her. Efektivnost těchto úprav je ukázána na několika experimentech provedených na hrách typu pronásledování-únik.cze
dc.description.abstractReward regularization proved to be a powerful technique in reinforcement learning algorithms for solving imperfect information games. One such algorithm using this technique is the recently developed Regularized Nash Dynamics (RNaD), which achieved a human-expert level performance in the game Stratego. However, research about this technique has focused on two-player zero-sum games, and it is currently unknown if this technique proves useful even in a broader class of games like general-sum or multiplayer games. Hence, this work aims to devise a more generally applicable extension of these techniques and modify the developed algorithms into a new class of games. The effectiveness of these modifications is shown in several experiments on pursuit-evasion games.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjecthry s neúplnou informacícze
dc.subjecthry bez nulového součtucze
dc.subjectvícehráčové hrycze
dc.subjectposilované učenícze
dc.subjecthry pronásledování-únikcze
dc.subjectregularizace odměncze
dc.subjectNashovo ekvilibriumcze
dc.subjectRegularizovaná Nashova dynamikacze
dc.subjectimperfect information gameseng
dc.subjectgeneral-sum gameseng
dc.subjectmultiplayer gameseng
dc.subjectreinforcement learningeng
dc.subjectpursuit-evasion gameseng
dc.subjectreward regularizationeng
dc.subjectNash equilibriumeng
dc.subjectRegularized Nash Dynamicseng
dc.titleVyužití metody regularizace odměn ve hrách s neúplnou informacícze
dc.titleLeveraging Reward Regularization in Imperfect Information Gameseng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeGrus Josef
theses.degree.disciplinePočítačové hry a grafikacze
theses.degree.grantorkatedra počítačové grafiky a interakcecze
theses.degree.programmeOtevřená informatikacze


Soubory tohoto záznamu





Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam