Řídicí systém pro robota SK8O využívající posilované učení

V této diplomové práci se věnuji posilovanému učení a jeho využití pro balancování a sledování rychlostní reference kolového dvounohého robota zvaného SK8O. Za tímto účelem jsou vytvořena dvě simulační prostředí: první modeluje linearní aproximaci Segwaye a druhý je plnou 3D simulací systému. Tato prostředí jsou následně použita k tréninku hlubokých neuronových sítí pomocí algoritmu Soft Actor-Critic a jeho variant. Výsledné regulátory jsou oveřeny v simulacích a na vestavném systému ve skutečném robotovi. Práci zakončuje zvážení odpovědnosti umělé inteligence spolu s úvodem do metod oboru vysvětlitelné umělé inteligence.

In this master's thesis, I explore the application of reinforcement learning techniques to balancing and velocity tracking of a bipedal wheeled robot named SK8O. To this end, two distinct training environments are developed: one emulating a linear Segway model and another that performs a full 3D rigid body simulation. These environments are then used to train deep neural networks using the Soft Actor-Critic algorithm and its variants. The resulting controllers are verified in simulations and on the embedded system in the real robot. The work concludes with a consideration of artificial intelligence liability and an introduction to the methods of explainable artificial intelligence.

Keywords

posilované učení, transfer ze simulace na skutečný systém, mujoco, soft actor-critic, vysvětlitelná umělá inteligence, SK8O, reinforcement learning, sim-to-real transfer, mujoco, soft actor-critic, explainable artificial intelligence, SK8O

Permanent link

http://hdl.handle.net/10467/109763

Rights/License

A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.

Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.

Collections

Master Theses - 13135

Full item page

Reinforcement learning-based control system for the SK8O robot