Heuristic Evaluation Functions for Imperfect-Information Chess
Heuristické evaluační funkce pro šachy s neúplnou informací
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date
Files
Abstract
Využití evalučních funkcí v řešení her s úplnou informací vedlo k dosažení nadlidských výkonů v několika hrách, jako šachy nebo Go. V oblasti velkých her s neúplnou informací, výzkum mířil především na poker, který má dobré vlastnosti, a nové metody nebyly využity a testovány na jiných hrách. V této práci předvedeme použití evaluačních funkcí v šachách s neúplnou informací. Navrhli jsme abstrakční model pro dvě varianty těchto šachů, Kriegspiel a Darkchess, a empericky předvedli jeho využití dosažením přibližné Nashovy rovnováhy minimalizováním upraveným CFR-D algoritmem. Otestovali jsme použití kovolučních neuronových sítí, které snižují potřebu herně specifického modelu. Nakonec jsme učinili krok k hraní v reálném čase použitím několika neuronových sítí v různých herních úrovních.
Using value function in depth-limited solving of perfect information games produced super-human play in several domains, like chess or Go. In the domain of large imperfect information games, research mainly focused on the game of poker, which possesses nice properties, and new methods were not used and tested on other domains. In this thesis, we present the use of value functions in imperfect information chess. We design an abstraction model for imperfect information chess variants, Kriegspiel and Darkchess, and empirically show its usability by computing approximate Nash equilibrium by a modified CFR-D algorithm. We test the use of a convolutional neural network to reduce the necessity of a domain-specific model. Finally, we take a step towards a real-time playing by using multiple neural networks at different depths as value functions.
Using value function in depth-limited solving of perfect information games produced super-human play in several domains, like chess or Go. In the domain of large imperfect information games, research mainly focused on the game of poker, which possesses nice properties, and new methods were not used and tested on other domains. In this thesis, we present the use of value functions in imperfect information chess. We design an abstraction model for imperfect information chess variants, Kriegspiel and Darkchess, and empirically show its usability by computing approximate Nash equilibrium by a modified CFR-D algorithm. We test the use of a convolutional neural network to reduce the necessity of a domain-specific model. Finally, we take a step towards a real-time playing by using multiple neural networks at different depths as value functions.