Solving Extensive-Form Games Using Imperfect Recall Abstraction
| dc.contributor.advisor | Pěchouček, Michal | |
| dc.contributor.author | Čermák, Jiří | |
| dc.contributor.referee | Polívka, Milan | |
| dc.date.accepted | ||
| dc.date.accessioned | 2018-03-22T14:32:02Z | |
| dc.date.available | 2018-03-22T14:32:02Z | |
| dc.date.issued | 2018-03-22 | |
| dc.description.abstract | Hry v extenzivní formě jsou důležitým modelem konečné sekvenční interakce hráčů. Extenzivní reprezentace her je však často příliš velká, což je hlavním důvodem zamezujícím aplikaci herně teoretických konceptů řešení do situací z reálného světa. Nejúspěšnější přístup řešící tento problém je metodologie informačních abstrakcí. Informační abstrakce zmenšují velikost původní extenzivní hry odebíráním informací, které mají hráči k dispozici. To vede ke sjednocování informačních setů tvořících jejich body rozhodnutí. Jelikož hráči musejí hrát identickou strategii ve sjednocených informačních setech, velikost strategie v abstrahované hře může být výrazně menší než v původní hře. Tato abstrahovaná hra je vyřešena a malé strategie získané jejím řešením jsou aplikovány do původní hry. Většina existujících přístupů využívající informační abstrakce vytváří abstrahovanou hru, kde si hráči pamatují všechny své tahy a veškeré informace, které během hry získali -- vlastnost nazvaná perfect recall. Pamatování si všech akcí však způsobuje exponenciální růst počtu bodů rozhodnutí (a tedy i velikosti strategie) vzhledem k počtu těchto akcí. V této práci se zaměřujeme na imperfect recall informační abstrakce, které umožňují hráčům zapomínat. Tyto abstrakce mají tedy potenciál vést k exponenciálně menším abstrahovaným hrám. V této práci poskytujeme následující tři hlavní kontribuce k řešení her v extenzivní formě. Zaprvé poskytujeme ucelený popis složitosti řešení imperfect recall informačních abstrakcí. Zadruhé představujeme první třídu doménově nezávislých algoritmů schopných aproximovat strategie s nejvyšší očekávanou hodnotou v nejhorším případě v imperfect recall informačních abstrakcích. Zatřetí představujeme dva doménově nezávislé algoritmy, které mohou být inicializovány jakoukoliv imperfect recall abstrakcí řešené hry v extenzivní formě. Tyto algoritmy současně řeší a zlepšují danou abstrakci, dokud není dosaženo garantované konvergence k požadované aproximaci Nashova ekvilibria původní hry. Na závěr experimentálně demonstrujeme, že naše algoritmy využívající imperfect recall informační abstrakce používají mnohem méně paměti na vyřešení obrovských her v extenzivní formě oproti paměti používané současnými nejúspěšnějšími algoritmy pro řešení extenzivních her. Z toho plyne, že námi představené algoritmy umožňují zásadní zvýšení škálovatelnosti řešení extenzivních her. | cs |
| dc.description.abstract | Extensive-form games are an important model of finite sequential interaction between players. The size of the extensive-form representation is, however, often prohibitive and it is the most common cause preventing deployment of game-theoretic solution concepts to real-world scenarios. The state-of-the-art approach to solve this issue is the information abstraction methodology. The information abstraction reduces the size of the original large extensive-form game by removing information available to players; hence merging the information sets which from their decision points. | en |
| dc.identifier | KOS-591608531105 | |
| dc.identifier.uri | http://hdl.handle.net/10467/75527 | |
| dc.language.iso | ENG | |
| dc.publisher | České vysoké učení technické v Praze | cs |
| dc.publisher | Czech Technical University in Prague | en |
| dc.rights | A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. | en |
| dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. | cs |
| dc.subject | Teorie her,Hry v extenzivní formě,Informační abstrakce,Imperfect Recall,Nashovo ekvilibrium,Maxmin | cs |
| dc.subject | ame Theory,Extensive-Form Games,Information Abstraction,Imperfect Recall,Nash Equilibrium,Maxmin | en |
| dc.title | Řešení her v extensivní formě pomocí imperfect recall abstrakci | cs |
| dc.title | Solving Extensive-Form Games Using Imperfect Recall Abstraction | en |
| dc.type | doctoral thesis | en |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 436e5026-e5e4-4d12-af66-053db32631de | |
| relation.isAdvisorOfPublication.latestForDiscovery | 436e5026-e5e4-4d12-af66-053db32631de | |
| relation.isAuthorOfPublication | c99c1b11-f4ed-40cf-a7f1-5a2eb5b754e3 | |
| relation.isAuthorOfPublication.latestForDiscovery | c99c1b11-f4ed-40cf-a7f1-5a2eb5b754e3 | |
| relation.isRefereeOfPublication | c9ce1ba9-7b0a-459f-86df-4b5447146542 | |
| relation.isRefereeOfPublication.latestForDiscovery | c9ce1ba9-7b0a-459f-86df-4b5447146542 | |
| theses.degree.discipline | Informatika a výpočetní technika | cs |
| theses.degree.grantor | katedra počítačů | cs |
| theses.degree.programme | Elektrotechnika a informatika | cs |
Files
Original bundle
1 - 1 of 1
- Name:
- F3-D-2018-Cermak-Jiri-cermak.pdf
- Size:
- 1.68 MB
- Format:
- Adobe Portable Document Format
- Description:
- PLNY_TEXT