Reinforcement learning-based control system for the SK8O robot
Řídicí systém pro robota SK8O využívající posilované učení
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
Abstract
V této diplomové práci se věnuji posilovanému učení a jeho využití pro balancování a sledování rychlostní reference kolového dvounohého robota zvaného SK8O. Za tímto účelem jsou vytvořena dvě simulační prostředí: první modeluje linearní aproximaci Segwaye a druhý je plnou 3D simulací systému. Tato prostředí jsou následně použita k tréninku hlubokých neuronových sítí pomocí algoritmu Soft Actor-Critic a jeho variant. Výsledné regulátory jsou oveřeny v simulacích a na vestavném systému ve skutečném robotovi. Práci zakončuje zvážení odpovědnosti umělé inteligence spolu s úvodem do metod oboru vysvětlitelné umělé inteligence.
In this master's thesis, I explore the application of reinforcement learning techniques to balancing and velocity tracking of a bipedal wheeled robot named SK8O. To this end, two distinct training environments are developed: one emulating a linear Segway model and another that performs a full 3D rigid body simulation. These environments are then used to train deep neural networks using the Soft Actor-Critic algorithm and its variants. The resulting controllers are verified in simulations and on the embedded system in the real robot. The work concludes with a consideration of artificial intelligence liability and an introduction to the methods of explainable artificial intelligence.
In this master's thesis, I explore the application of reinforcement learning techniques to balancing and velocity tracking of a bipedal wheeled robot named SK8O. To this end, two distinct training environments are developed: one emulating a linear Segway model and another that performs a full 3D rigid body simulation. These environments are then used to train deep neural networks using the Soft Actor-Critic algorithm and its variants. The resulting controllers are verified in simulations and on the embedded system in the real robot. The work concludes with a consideration of artificial intelligence liability and an introduction to the methods of explainable artificial intelligence.
Description
Citation
Underlying research data set URL
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.