Prohlížení katedry dle předmětu "reinforcement learning"
Zobrazují se záznamy 1-10 z 10
-
Abstrakce v posilovaném učení
; Vedoucí práce: Platt Robert; Oponent práce: Maldonado Lopez Juan Pablo
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2019-06-15)Abstrakce je důležitý nástroj pro inteligentního agenta. Pomáhá mu řešit složité úlohy tím, že ignoruje nedůležité detaily. V této práci popíši nový algoritmus pro hledání abstrakcí, Online Partition Iteration, který je ... -
Aplikace neuronových sítí v šachové hře
; Vedoucí práce: Smítková Janků Ladislava; Oponent práce: Glaser Jan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-22)Tato práce se zaměřuje na využití neuronových sítí v šachovém enginu. Neuronové sítě jsou trénovány jak pomocí supervizovaného, tak pomocí posilovaného učení. Pro supervizovanou část práce byl navržen algoritmus automatického ... -
Efektivní implementace neuroevoluce pro úlohy posilovaného učení
; Vedoucí práce: Kordík Pavel; Oponent práce: Šimeček Ivan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-20)Bakalářská práce má za cíl vytvořit knihovnu, která umožňuje běh neuroevolučních algoritmů v prostředí webového prohlížeče. Ani neuroevoluce ani strojové učení nejsou v prostředí webového prohlížeče moc populární. Problém ... -
Implementace Q* algoritmu v Julia
; Vedoucí práce: Kalvoda Tomáš; Oponent práce: Klouda Karel
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-19)V této bakalářské práci je představen algoritmus Q*, společně s algoritmem A*, na kterém je založen. Je vysvětlen systém automatického získávání heuristických funkcí pomocí metod posilovaného učení, konkrétně algoritmy ... -
Jak těžké je chytit Krabčáka?
; Vedoucí práce: Schierreich Šimon; Oponent práce: Šimeček Ivan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-09)Tato práce se zabývá studiem karetní hry Krabčáci, a to jak z hlediska složitosti i nalezení optimální výherní strategie. Bude představen obecný matematický model pro hru ze kterého je možné tvořit jednodušší varianty hry. ... -
Kombinatoriální řešiče v hlubokém zpětnovazebním učení
; Vedoucí práce: Škoviera Radoslav; Oponent práce: Surynek Pavel
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-15)Tato bakalárska práce měří účinost alternatiního modelování logických vztahů mezi daty v rámci zpětnovazebního učení. Pomocí SATNetu, který dokáže tyto vztahy aproximovat, bylo v bakalářské práci nalezeno, že agenti s SAT ... -
Model autonomního řízení pro vyhýbání se překážkám na trati
; Vedoucí práce: Čepek Miroslav; Oponent práce: Buk Zdeněk
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-23)V rámci této práce byl proveden literární průzkum různých metodik autonomního řízení a architektur modelů strojového učení se zaměřením na vyhýbání se objektům. Práce dále zkoumá možnosti platformy autonomního závodního ... -
Učení přistávání samořiditelných letadel
; Vedoucí práce: Maldonado Lopez Juan Pablo; Oponent práce: Starosta Štěpán
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2019-06-08)Táto práca sa zaoberá problematikou umelej inteligencie zameranej na pristávanie dopravného lietadla Boeing 737-800. Ako simulačné prostredie využíva X-Plane 11 a na základe dát extrahovaných z tohoto simulátora natrénujeme ... -
Využití algoritmu Monte Carlo Tree Search pro hraní šachu
; Vedoucí práce: Vašata Daniel; Oponent práce: Surynek Pavel
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-19)Tato práce se zabývá využitím algoritmu Monte Carlo tree search a jeho kombinace s neuronovými sítěmi a hlubokým posilovaným učením pro hraní šachů. Teoretická část této práce přiblíží čtenáři posilované učení a jeho ... -
Zvětšování množiny dat pro posilování učení
; Vedoucí práce: Maldonado Lopez Juan Pablo; Oponent práce: Klouda Karel
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2019-06-19)V této práci je implementován nedávno představený framework pro posilované učení výzkumníků Ha a Schmidhubera nazvaný World Models. Ti přichází s originální myšlenkou naučit se svět z mnoha aspektů a ne jen ze zkušeností. ...