Now showing items 1-1 of 1

    • Využití metody regularizace odměn ve hrách s neúplnou informací 

      Author: Tomáš Holeček; Supervisor: Kubíček Ondřej; Opponent: Grus Josef
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-06)
      Regularizace odměn se ukázala jako užitečná technika pro algoritmy posilovaného učení určené k řešení her s neúplnou informací. Jeden takový algoritmus používající tuto techniku je nedávno vyvinutý algoritmus Regularizovaná ...