Řídicí systém pro robota SK8O využívající posilované učení
Reinforcement learning-based control system for the SK8O robot
Typ dokumentu
diplomová prácemaster thesis
Autor
Dominik Hodan
Vedoucí práce
Pučejdl Krištof
Oponent práce
Filip Jan
Studijní obor
Kybernetika a robotikaStudijní program
Kybernetika a robotikaInstituce přidělující hodnost
katedra řídicí technikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
V této diplomové práci se věnuji posilovanému učení a jeho využití pro balancování a sledování rychlostní reference kolového dvounohého robota zvaného SK8O. Za tímto účelem jsou vytvořena dvě simulační prostředí: první modeluje linearní aproximaci Segwaye a druhý je plnou 3D simulací systému. Tato prostředí jsou následně použita k tréninku hlubokých neuronových sítí pomocí algoritmu Soft Actor-Critic a jeho variant. Výsledné regulátory jsou oveřeny v simulacích a na vestavném systému ve skutečném robotovi. Práci zakončuje zvážení odpovědnosti umělé inteligence spolu s úvodem do metod oboru vysvětlitelné umělé inteligence. In this master's thesis, I explore the application of reinforcement learning techniques to balancing and velocity tracking of a bipedal wheeled robot named SK8O. To this end, two distinct training environments are developed: one emulating a linear Segway model and another that performs a full 3D rigid body simulation. These environments are then used to train deep neural networks using the Soft Actor-Critic algorithm and its variants. The resulting controllers are verified in simulations and on the embedded system in the real robot. The work concludes with a consideration of artificial intelligence liability and an introduction to the methods of explainable artificial intelligence.
Kolekce
- Diplomové práce - 13135 [315]