Solving Extensive-Form Games Using Imperfect Recall Abstraction

dc.contributor.advisor Pěchouček, Michal
dc.contributor.author Čermák, Jiří
dc.contributor.referee Polívka, Milan
dc.date.accepted
dc.date.accessioned 2018-03-22T14:32:02Z
dc.date.available 2018-03-22T14:32:02Z
dc.date.issued 2018-03-22
dc.description.abstract Hry v extenzivní formě jsou důležitým modelem konečné sekvenční interakce hráčů. Extenzivní reprezentace her je však často příliš velká, což je hlavním důvodem zamezujícím aplikaci herně teoretických konceptů řešení do situací z reálného světa. Nejúspěšnější přístup řešící tento problém je metodologie informačních abstrakcí. Informační abstrakce zmenšují velikost původní extenzivní hry odebíráním informací, které mají hráči k dispozici. To vede ke sjednocování informačních setů tvořících jejich body rozhodnutí. Jelikož hráči musejí hrát identickou strategii ve sjednocených informačních setech, velikost strategie v abstrahované hře může být výrazně menší než v původní hře. Tato abstrahovaná hra je vyřešena a malé strategie získané jejím řešením jsou aplikovány do původní hry. Většina existujících přístupů využívající informační abstrakce vytváří abstrahovanou hru, kde si hráči pamatují všechny své tahy a veškeré informace, které během hry získali -- vlastnost nazvaná perfect recall. Pamatování si všech akcí však způsobuje exponenciální růst počtu bodů rozhodnutí (a tedy i velikosti strategie) vzhledem k počtu těchto akcí. V této práci se zaměřujeme na imperfect recall informační abstrakce, které umožňují hráčům zapomínat. Tyto abstrakce mají tedy potenciál vést k exponenciálně menším abstrahovaným hrám. V této práci poskytujeme následující tři hlavní kontribuce k řešení her v extenzivní formě. Zaprvé poskytujeme ucelený popis složitosti řešení imperfect recall informačních abstrakcí. Zadruhé představujeme první třídu doménově nezávislých algoritmů schopných aproximovat strategie s nejvyšší očekávanou hodnotou v nejhorším případě v imperfect recall informačních abstrakcích. Zatřetí představujeme dva doménově nezávislé algoritmy, které mohou být inicializovány jakoukoliv imperfect recall abstrakcí řešené hry v extenzivní formě. Tyto algoritmy současně řeší a zlepšují danou abstrakci, dokud není dosaženo garantované konvergence k požadované aproximaci Nashova ekvilibria původní hry. Na závěr experimentálně demonstrujeme, že naše algoritmy využívající imperfect recall informační abstrakce používají mnohem méně paměti na vyřešení obrovských her v extenzivní formě oproti paměti používané současnými nejúspěšnějšími algoritmy pro řešení extenzivních her. Z toho plyne, že námi představené algoritmy umožňují zásadní zvýšení škálovatelnosti řešení extenzivních her. cs
dc.description.abstract Extensive-form games are an important model of finite sequential interaction between players. The size of the extensive-form representation is, however, often prohibitive and it is the most common cause preventing deployment of game-theoretic solution concepts to real-world scenarios. The state-of-the-art approach to solve this issue is the information abstraction methodology. The information abstraction reduces the size of the original large extensive-form game by removing information available to players; hence merging the information sets which from their decision points. en
dc.identifier KOS-591608531105
dc.identifier.uri http://hdl.handle.net/10467/75527
dc.language.iso ENG
dc.publisher České vysoké učení technické v Praze cs
dc.publisher Czech Technical University in Prague en
dc.rights A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. en
dc.rights Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. cs
dc.subject Teorie her,Hry v extenzivní formě,Informační abstrakce,Imperfect Recall,Nashovo ekvilibrium,Maxmin cs
dc.subject ame Theory,Extensive-Form Games,Information Abstraction,Imperfect Recall,Nash Equilibrium,Maxmin en
dc.title Řešení her v extensivní formě pomocí imperfect recall abstrakci cs
dc.title Solving Extensive-Form Games Using Imperfect Recall Abstraction en
dc.type doctoral thesis en
dspace.entity.type Publication
relation.isAdvisorOfPublication 436e5026-e5e4-4d12-af66-053db32631de
relation.isAdvisorOfPublication.latestForDiscovery 436e5026-e5e4-4d12-af66-053db32631de
relation.isAuthorOfPublication c99c1b11-f4ed-40cf-a7f1-5a2eb5b754e3
relation.isAuthorOfPublication.latestForDiscovery c99c1b11-f4ed-40cf-a7f1-5a2eb5b754e3
relation.isRefereeOfPublication c9ce1ba9-7b0a-459f-86df-4b5447146542
relation.isRefereeOfPublication.latestForDiscovery c9ce1ba9-7b0a-459f-86df-4b5447146542
theses.degree.discipline Informatika a výpočetní technika cs
theses.degree.grantor katedra počítačů cs
theses.degree.programme Elektrotechnika a informatika cs

Files

Original bundle

Now showing 1 - 1 of 1
Name:
F3-D-2018-Cermak-Jiri-cermak.pdf
Size:
1.68 MB
Format:
Adobe Portable Document Format
Description:
PLNY_TEXT