Zobrazit minimální záznam

Reinforcement learning for control of dynamical systems



dc.contributor.advisorHušek Petr
dc.contributor.authorDo Loi
dc.date.accessioned2017-06-07T09:43:14Z
dc.date.available2017-06-07T09:43:14Z
dc.date.issued2017-05-16
dc.identifierKOS-587865103105
dc.identifier.urihttp://hdl.handle.net/10467/68408
dc.description.abstractTato bakalářská práce se zabývá použitím metod strojového učení označované jako Posilované učení (Reinforcement learning) pro řízení dynamických systémů. První část této práce je věnovaná úvodu do problematiky Posilovaného učení. Je zde popsán teoretický rámec používaný ve strojovém učení. Definovány jsou základní pojmy a hlavně je představen popis úlohy pomocí Markovského rozhodovacího procesu. Další část práce je pak věnovaná přehledu metod, které se používají pro řešení úloh popsaných jako Markovské rozhodovací procesy. Ukázány jsou základní metody založené na dynamickém programování a posléze metody založené na konceptu Temporální diference. Vybraná metoda je nakonec použita pro řízení simulačního modelu dynamického sytému.cze
dc.description.abstractThis bachelor thesis deals with use of machine learning methods known as Reinforcement learning for control of dynamic system. First part of this thesis is dedicated to introduction to problematics of Reinforcement learning. Theoretical framework used in machine learning is described here. Basic terms are defined and mainly the description of task is described using Markov decision process. Next part of the work is dedicated to survey of methods used for solution of task described as Markov decision process. Basic methods based on Dynamic programming and Temporal difference are shown. Selected method is eventually used for control simulated model of dynamic system.eng
dc.language.isoCZE
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectposilované učení, markovův rozhodovací proces, řízení dynamického sytému, aproximace funkcecze
dc.subjectreinforcement learning, markov decision process, control of dynamic systems, function approximationeng
dc.titleReinforcement learning pro řízení dynamických systémůcze
dc.titleReinforcement learning for control of dynamical systemseng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.date.accepted2017-06-20
dc.contributor.refereeAugusta Petr
theses.degree.disciplineSystémy a řízenícze
theses.degree.grantorkatedra řídicí technikycze
theses.degree.programmeKybernetika a robotikacze


Soubory tohoto záznamu





Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam