Reinforcement learning pro řízení dynamických systémů

Do Loi

Reinforcement learning for control of dynamical systems

Type of document

bakalářská práce
bachelor thesis

Author

Do Loi

Supervisor

Hušek Petr

Opponent

Augusta Petr

Field of study

Systémy a řízení

Study program

Kybernetika a robotika

Institutions assigning rank

katedra řídicí techniky

Defended

2017-06-20

Rights

A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html

Metadata

Show full item record

Abstract

Tato bakalářská práce se zabývá použitím metod strojového učení označované jako Posilované učení (Reinforcement learning) pro řízení dynamických systémů. První část této práce je věnovaná úvodu do problematiky Posilovaného učení. Je zde popsán teoretický rámec používaný ve strojovém učení. Definovány jsou základní pojmy a hlavně je představen popis úlohy pomocí Markovského rozhodovacího procesu. Další část práce je pak věnovaná přehledu metod, které se používají pro řešení úloh popsaných jako Markovské rozhodovací procesy. Ukázány jsou základní metody založené na dynamickém programování a posléze metody založené na konceptu Temporální diference. Vybraná metoda je nakonec použita pro řízení simulačního modelu dynamického sytému.

This bachelor thesis deals with use of machine learning methods known as Reinforcement learning for control of dynamic system. First part of this thesis is dedicated to introduction to problematics of Reinforcement learning. Theoretical framework used in machine learning is described here. Basic terms are defined and mainly the description of task is described using Markov decision process. Next part of the work is dedicated to survey of methods used for solution of task described as Markov decision process. Basic methods based on Dynamic programming and Temporal difference are shown. Selected method is eventually used for control simulated model of dynamic system.