Použití iterativního double-oracle algoritmu pro řešení zjednodušené varianty pokru
Using Sequence-Form Double-Oracle Algorithm for Simplified Poker
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Münch Martin
Vedoucí práce
Bošanský Branislav
Oponent práce
Schaefer Martin
Studijní obor
Informatika a počítačové vědyStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra kybernetikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Zobrazit celý záznamAbstrakt
Poker je jednou z populárních domén teorie her, která se často ve zjednodušené formě využívá pro porovnávání a evaluaci algoritmů. V této práci používáme sequence-form double-oracle algoritmus, což je obecný iterativní algoritmus hledající řešení pro extenzivní hry s nulovým součtem. Intuice algoritmu je následující: nejprve se vytvoří omezená hra, kde hráči mají omezené akce, které mohou zahrát. Najde se řešení této omezené hry a následně se rozšíří o nové akce odpovídající nejlepší možné strategii. Rychlost obecného double oraclu není pro Poker ideální. Metody obecného algoritmu jdou nahradit metodami využívající vlastnosti dané domény. Proto je cílem této práce (1) prozkoumat možnosti kompaktnější reprezentace hry Pokru, (2) prozkoumat různé možnosti pro výběr akcí, které rozšíří omezenou hru a (3) experimentálně porovnat navržené metody vzhledem k obecnému double oracle. Poker is one of the popular domains of game theory and it is used (in a simplified form) as a benchmark domain for comparing the algorithms for solving finite sequential games. In this thesis, we use sequence-form double-oracle algorithm, iterative approach for finding an exact Nash equilibirum for extensive-form zero-sum games. Intiution behind this agorithm is the following: firstly, it creates a game with restricted possible sequences of actions for players. Secondly, it solves this restricted game, and finally, it finds the best response against the solution of restricted game and expands the restricted game by the best-response sequences. In poker performance of domain-independent double oracle is not good. But the methods of the general algorithm can be replaced by domain-specific methods. Therefore, the goal of this thesis is (1) explore possible compact representation of Poker, (2) explore different methods for selecting actions to expand the restricted game, (3) experimentally compare proposed methods with general double oracle.
Kolekce
- Bakalářské práce - 13133 [778]