Browsing Bakalářské práce - 13139 by Subject "Regularizovaná Nashova dynamika"
Now showing items 1-1 of 1
-
Využití metody regularizace odměn ve hrách s neúplnou informací
; Supervisor: Kubíček Ondřej; Opponent: Grus Josef
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-06)Regularizace odměn se ukázala jako užitečná technika pro algoritmy posilovaného učení určené k řešení her s neúplnou informací. Jeden takový algoritmus používající tuto techniku je nedávno vyvinutý algoritmus Regularizovaná ...