Heuristické evaluační funkce pro šachy s neúplnou informací
Heuristic Evaluation Functions for Imperfect-Information Chess
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Matěj Šesták
Vedoucí práce
Seitz Dominik Andreas
Oponent práce
Kléma Jiří
Studijní obor
Informatika a počítačové vědyStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra kybernetikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Využití evalučních funkcí v řešení her s úplnou informací vedlo k dosažení nadlidských výkonů v několika hrách, jako šachy nebo Go. V oblasti velkých her s neúplnou informací, výzkum mířil především na poker, který má dobré vlastnosti, a nové metody nebyly využity a testovány na jiných hrách. V této práci předvedeme použití evaluačních funkcí v šachách s neúplnou informací. Navrhli jsme abstrakční model pro dvě varianty těchto šachů, Kriegspiel a Darkchess, a empericky předvedli jeho využití dosažením přibližné Nashovy rovnováhy minimalizováním upraveným CFR-D algoritmem. Otestovali jsme použití kovolučních neuronových sítí, které snižují potřebu herně specifického modelu. Nakonec jsme učinili krok k hraní v reálném čase použitím několika neuronových sítí v různých herních úrovních. Using value function in depth-limited solving of perfect information games produced super-human play in several domains, like chess or Go. In the domain of large imperfect information games, research mainly focused on the game of poker, which possesses nice properties, and new methods were not used and tested on other domains. In this thesis, we present the use of value functions in imperfect information chess. We design an abstraction model for imperfect information chess variants, Kriegspiel and Darkchess, and empirically show its usability by computing approximate Nash equilibrium by a modified CFR-D algorithm. We test the use of a convolutional neural network to reduce the necessity of a domain-specific model. Finally, we take a step towards a real-time playing by using multiple neural networks at different depths as value functions.
Kolekce
- Bakalářské práce - 13133 [778]