Řešení her v extensivní formě pomocí imperfect recall abstrakci

Čermák, Jiří

Solving Extensive-Form Games Using Imperfect Recall Abstraction

dc.contributor.advisor	Pěchouček, Michal
dc.contributor.author	Čermák, Jiří
dc.contributor.referee	Polívka, Milan
dc.date.accepted
dc.date.accessioned	2018-03-22T14:32:02Z
dc.date.available	2018-03-22T14:32:02Z
dc.date.issued	2018-03-22
dc.description.abstract	Hry v extenzivní formě jsou důležitým modelem konečné sekvenční interakce hráčů. Extenzivní reprezentace her je však často příliš velká, což je hlavním důvodem zamezujícím aplikaci herně teoretických konceptů řešení do situací z reálného světa. Nejúspěšnější přístup řešící tento problém je metodologie informačních abstrakcí. Informační abstrakce zmenšují velikost původní extenzivní hry odebíráním informací, které mají hráči k dispozici. To vede ke sjednocování informačních setů tvořících jejich body rozhodnutí. Jelikož hráči musejí hrát identickou strategii ve sjednocených informačních setech, velikost strategie v abstrahované hře může být výrazně menší než v původní hře. Tato abstrahovaná hra je vyřešena a malé strategie získané jejím řešením jsou aplikovány do původní hry. Většina existujících přístupů využívající informační abstrakce vytváří abstrahovanou hru, kde si hráči pamatují všechny své tahy a veškeré informace, které během hry získali -- vlastnost nazvaná perfect recall. Pamatování si všech akcí však způsobuje exponenciální růst počtu bodů rozhodnutí (a tedy i velikosti strategie) vzhledem k počtu těchto akcí. V této práci se zaměřujeme na imperfect recall informační abstrakce, které umožňují hráčům zapomínat. Tyto abstrakce mají tedy potenciál vést k exponenciálně menším abstrahovaným hrám. V této práci poskytujeme následující tři hlavní kontribuce k řešení her v extenzivní formě. Zaprvé poskytujeme ucelený popis složitosti řešení imperfect recall informačních abstrakcí. Zadruhé představujeme první třídu doménově nezávislých algoritmů schopných aproximovat strategie s nejvyšší očekávanou hodnotou v nejhorším případě v imperfect recall informačních abstrakcích. Zatřetí představujeme dva doménově nezávislé algoritmy, které mohou být inicializovány jakoukoliv imperfect recall abstrakcí řešené hry v extenzivní formě. Tyto algoritmy současně řeší a zlepšují danou abstrakci, dokud není dosaženo garantované konvergence k požadované aproximaci Nashova ekvilibria původní hry. Na závěr experimentálně demonstrujeme, že naše algoritmy využívající imperfect recall informační abstrakce používají mnohem méně paměti na vyřešení obrovských her v extenzivní formě oproti paměti používané současnými nejúspěšnějšími algoritmy pro řešení extenzivních her. Z toho plyne, že námi představené algoritmy umožňují zásadní zvýšení škálovatelnosti řešení extenzivních her.	cs
dc.description.abstract	Extensive-form games are an important model of finite sequential interaction between players. The size of the extensive-form representation is, however, often prohibitive and it is the most common cause preventing deployment of game-theoretic solution concepts to real-world scenarios. The state-of-the-art approach to solve this issue is the information abstraction methodology. The information abstraction reduces the size of the original large extensive-form game by removing information available to players; hence merging the information sets which from their decision points.	en
dc.identifier	KOS-591608531105
dc.identifier.uri	http://hdl.handle.net/10467/75527
dc.language.iso	ENG
dc.publisher	České vysoké učení technické v Praze	cs
dc.publisher	Czech Technical University in Prague	en
dc.rights	A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.	en
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.	cs
dc.subject	Teorie her,Hry v extenzivní formě,Informační abstrakce,Imperfect Recall,Nashovo ekvilibrium,Maxmin	cs
dc.subject	ame Theory,Extensive-Form Games,Information Abstraction,Imperfect Recall,Nash Equilibrium,Maxmin	en
dc.title	Řešení her v extensivní formě pomocí imperfect recall abstrakci	cs
dc.title	Solving Extensive-Form Games Using Imperfect Recall Abstraction	en
dc.type	doctoral thesis	en
dspace.entity.type	Publication
relation.isAdvisorOfPublication	436e5026-e5e4-4d12-af66-053db32631de
relation.isAdvisorOfPublication.latestForDiscovery	436e5026-e5e4-4d12-af66-053db32631de
relation.isAuthorOfPublication	c99c1b11-f4ed-40cf-a7f1-5a2eb5b754e3
relation.isAuthorOfPublication.latestForDiscovery	c99c1b11-f4ed-40cf-a7f1-5a2eb5b754e3
relation.isRefereeOfPublication	c9ce1ba9-7b0a-459f-86df-4b5447146542
relation.isRefereeOfPublication.latestForDiscovery	c9ce1ba9-7b0a-459f-86df-4b5447146542
theses.degree.discipline	Informatika a výpočetní technika	cs
theses.degree.grantor	katedra počítačů	cs
theses.degree.programme	Elektrotechnika a informatika	cs

Files

Original bundle

Now showing 1 - 1 of 1

Name:: F3-D-2018-Cermak-Jiri-cermak.pdf
Size:: 1.68 MB
Format:: Adobe Portable Document Format
Description:: PLNY_TEXT

Download

Collections

Doctoral Theses - 13000