Reinforcement learning pro řízení dynamických systémů
Reinforcement learning for control of dynamical systems
dc.contributor.advisor | Hušek Petr | |
dc.contributor.author | Do Loi | |
dc.date.accessioned | 2017-06-07T09:43:14Z | |
dc.date.available | 2017-06-07T09:43:14Z | |
dc.date.issued | 2017-05-16 | |
dc.identifier | KOS-587865103105 | |
dc.identifier.uri | http://hdl.handle.net/10467/68408 | |
dc.description.abstract | Tato bakalářská práce se zabývá použitím metod strojového učení označované jako Posilované učení (Reinforcement learning) pro řízení dynamických systémů. První část této práce je věnovaná úvodu do problematiky Posilovaného učení. Je zde popsán teoretický rámec používaný ve strojovém učení. Definovány jsou základní pojmy a hlavně je představen popis úlohy pomocí Markovského rozhodovacího procesu. Další část práce je pak věnovaná přehledu metod, které se používají pro řešení úloh popsaných jako Markovské rozhodovací procesy. Ukázány jsou základní metody založené na dynamickém programování a posléze metody založené na konceptu Temporální diference. Vybraná metoda je nakonec použita pro řízení simulačního modelu dynamického sytému. | cze |
dc.description.abstract | This bachelor thesis deals with use of machine learning methods known as Reinforcement learning for control of dynamic system. First part of this thesis is dedicated to introduction to problematics of Reinforcement learning. Theoretical framework used in machine learning is described here. Basic terms are defined and mainly the description of task is described using Markov decision process. Next part of the work is dedicated to survey of methods used for solution of task described as Markov decision process. Basic methods based on Dynamic programming and Temporal difference are shown. Selected method is eventually used for control simulated model of dynamic system. | eng |
dc.language.iso | CZE | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | posilované učení, markovův rozhodovací proces, řízení dynamického sytému, aproximace funkce | cze |
dc.subject | reinforcement learning, markov decision process, control of dynamic systems, function approximation | eng |
dc.title | Reinforcement learning pro řízení dynamických systémů | cze |
dc.title | Reinforcement learning for control of dynamical systems | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.date.accepted | 2017-06-20 | |
dc.contributor.referee | Augusta Petr | |
theses.degree.discipline | Systémy a řízení | cze |
theses.degree.grantor | katedra řídicí techniky | cze |
theses.degree.programme | Kybernetika a robotika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 13135 [456]