Zobrazit minimální záznam

Learning Dynamic System Control on a Data Driven Model



dc.contributor.advisorAzayev Teymur
dc.contributor.authorAleksandr Barinov
dc.date.accessioned2022-06-08T22:52:02Z
dc.date.available2022-06-08T22:52:02Z
dc.date.issued2022-06-08
dc.identifierKOS-958759637005
dc.identifier.urihttp://hdl.handle.net/10467/101382
dc.description.abstractCílem teto práce je empiricky demonstrovat, že založená na neuronových sitích řidicí strategie naučena na datově získaném nelineárním dynamickém systému může dosahnout lepšího přenosu ze simulace do skutečného světa néž řidicí strategie naučena na state-of-the-art fyzikálním motoru MuJoCo. Obě strategie nejprv ohodnocene ve simulačním prostředí, na kterém byli trénovani a pak na fyzické platformě. Kromě toho se pokoušíme naučit robustní strategije schopnou kontrolovat nelineární dynamický system na náhodných zakřivených trajektoriích s blízkým ke lidskému řidiču výkonem. Pokusy ukazují, že výkon strategie naučene na datově získanem modelu trpí vyznamně míň za přechodu do skutečného světa néž strategie naučena na MuJoCo enginu. Nasazení naučenych strategií na validační sadu trajektorií demonstruje vysoký blízký ke lidskému řidiču výkon a slušnou schopnost ke generalizace. Kód je zdarma přistupný na githubu \url{https://github.com/barinalex/thesis}. \end{abstract-czech}cze
dc.description.abstractThe aim of this work is to empirically demonstrate that a neural network control policy learned on a data-driven nonlinear dynamical system may achieve better simulation-to-real world transfer than a control policy learned on a state-of-the-art physics engine MuJoCo. Both control policies are at first evaluated in a simulation environment they were trained in and next on a physical platform. In addition, we attempt to learn a robust policy able to control nonlinear dynamics system on random curved trajectories with close to human driver performance. Experiments show that the performance of the policy learned on the data-driven model suffers significantly less from transfer to the real world than that of the policy learned on the MuJoCo engine. Deployment of learned policies on a validation set of trajectories demonstrates high close to human driver performance and a decent ability to generalize. Code is freely available on github \url{https://github.com/barinalex/thesis}.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectdatově získaný modelcze
dc.subjectřídicí strategiecze
dc.subjectzpětnovazební učenícze
dc.subjectdata-driven modeleng
dc.subjectcontrol policyeng
dc.subjectreinforcement learningeng
dc.titleUčení řídicího algoritmu na datově získaném modelucze
dc.titleLearning Dynamic System Control on a Data Driven Modeleng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeKlaučo Martin
theses.degree.disciplineZáklady umělé inteligence a počítačových vědcze
theses.degree.grantorkatedra kybernetikycze
theses.degree.programmeOtevřená informatikacze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam