Učení řídicího algoritmu na datově získaném modelu
Learning Dynamic System Control on a Data Driven Model
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Aleksandr Barinov
Vedoucí práce
Azayev Teymur
Oponent práce
Klaučo Martin
Studijní obor
Základy umělé inteligence a počítačových vědStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra kybernetikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Cílem teto práce je empiricky demonstrovat, že založená na neuronových sitích řidicí strategie naučena na datově získaném nelineárním dynamickém systému může dosahnout lepšího přenosu ze simulace do skutečného světa néž řidicí strategie naučena na state-of-the-art fyzikálním motoru MuJoCo. Obě strategie nejprv ohodnocene ve simulačním prostředí, na kterém byli trénovani a pak na fyzické platformě. Kromě toho se pokoušíme naučit robustní strategije schopnou kontrolovat nelineární dynamický system na náhodných zakřivených trajektoriích s blízkým ke lidskému řidiču výkonem. Pokusy ukazují, že výkon strategie naučene na datově získanem modelu trpí vyznamně míň za přechodu do skutečného světa néž strategie naučena na MuJoCo enginu. Nasazení naučenych strategií na validační sadu trajektorií demonstruje vysoký blízký ke lidskému řidiču výkon a slušnou schopnost ke generalizace. Kód je zdarma přistupný na githubu \url{https://github.com/barinalex/thesis}. \end{abstract-czech} The aim of this work is to empirically demonstrate that a neural network control policy learned on a data-driven nonlinear dynamical system may achieve better simulation-to-real world transfer than a control policy learned on a state-of-the-art physics engine MuJoCo. Both control policies are at first evaluated in a simulation environment they were trained in and next on a physical platform. In addition, we attempt to learn a robust policy able to control nonlinear dynamics system on random curved trajectories with close to human driver performance. Experiments show that the performance of the policy learned on the data-driven model suffers significantly less from transfer to the real world than that of the policy learned on the MuJoCo engine. Deployment of learned policies on a validation set of trajectories demonstrates high close to human driver performance and a decent ability to generalize. Code is freely available on github \url{https://github.com/barinalex/thesis}.
Kolekce
- Bakalářské práce - 13133 [778]