Učení řídicího algoritmu na datově získaném modelu
Learning Dynamic System Control on a Data Driven Model
dc.contributor.advisor | Azayev Teymur | |
dc.contributor.author | Aleksandr Barinov | |
dc.date.accessioned | 2022-06-08T22:52:02Z | |
dc.date.available | 2022-06-08T22:52:02Z | |
dc.date.issued | 2022-06-08 | |
dc.identifier | KOS-958759637005 | |
dc.identifier.uri | http://hdl.handle.net/10467/101382 | |
dc.description.abstract | Cílem teto práce je empiricky demonstrovat, že založená na neuronových sitích řidicí strategie naučena na datově získaném nelineárním dynamickém systému může dosahnout lepšího přenosu ze simulace do skutečného světa néž řidicí strategie naučena na state-of-the-art fyzikálním motoru MuJoCo. Obě strategie nejprv ohodnocene ve simulačním prostředí, na kterém byli trénovani a pak na fyzické platformě. Kromě toho se pokoušíme naučit robustní strategije schopnou kontrolovat nelineární dynamický system na náhodných zakřivených trajektoriích s blízkým ke lidskému řidiču výkonem. Pokusy ukazují, že výkon strategie naučene na datově získanem modelu trpí vyznamně míň za přechodu do skutečného světa néž strategie naučena na MuJoCo enginu. Nasazení naučenych strategií na validační sadu trajektorií demonstruje vysoký blízký ke lidskému řidiču výkon a slušnou schopnost ke generalizace. Kód je zdarma přistupný na githubu \url{https://github.com/barinalex/thesis}. \end{abstract-czech} | cze |
dc.description.abstract | The aim of this work is to empirically demonstrate that a neural network control policy learned on a data-driven nonlinear dynamical system may achieve better simulation-to-real world transfer than a control policy learned on a state-of-the-art physics engine MuJoCo. Both control policies are at first evaluated in a simulation environment they were trained in and next on a physical platform. In addition, we attempt to learn a robust policy able to control nonlinear dynamics system on random curved trajectories with close to human driver performance. Experiments show that the performance of the policy learned on the data-driven model suffers significantly less from transfer to the real world than that of the policy learned on the MuJoCo engine. Deployment of learned policies on a validation set of trajectories demonstrates high close to human driver performance and a decent ability to generalize. Code is freely available on github \url{https://github.com/barinalex/thesis}. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | datově získaný model | cze |
dc.subject | řídicí strategie | cze |
dc.subject | zpětnovazební učení | cze |
dc.subject | data-driven model | eng |
dc.subject | control policy | eng |
dc.subject | reinforcement learning | eng |
dc.title | Učení řídicího algoritmu na datově získaném modelu | cze |
dc.title | Learning Dynamic System Control on a Data Driven Model | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Klaučo Martin | |
theses.degree.discipline | Základy umělé inteligence a počítačových věd | cze |
theses.degree.grantor | katedra kybernetiky | cze |
theses.degree.programme | Otevřená informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 13133 [787]