Prohlížení Bakalářské práce - 13139 dle autora "Tomáš Holeček"
-
Využití metody regularizace odměn ve hrách s neúplnou informací
Autor: Tomáš Holeček; Vedoucí práce: Kubíček Ondřej; Oponent práce: Grus Josef
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-06)Regularizace odměn se ukázala jako užitečná technika pro algoritmy posilovaného učení určené k řešení her s neúplnou informací. Jeden takový algoritmus používající tuto techniku je nedávno vyvinutý algoritmus Regularizovaná ...