Společné učení pro robotickou navigaci
Federated Learning for Robotic Navigation
Type of document
bakalářská prácebachelor thesis
Author
Jan Pikman
Supervisor
Rozsypálek Zdeněk
Opponent
Na Seongin
Field of study
Základy umělé inteligence a počítačových vědStudy program
Otevřená informatikaInstitutions assigning rank
katedra kybernetikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Tato práce se zaměřila na použití federovaného učení v kombinaci s hlubokým posilovaným učením k řešení problému robotické navigace s omezenou senzorickou výbavou. Byl učiněn pokus replikovat úspěch metody společného učení s měkkou aktualizací vah, která byla představena ve článku Federated Reinforcement Learning for Collective Navigation of Robotic Swarms. Součástí replikace bylo vytvoření prostředí, ve kterém se několik robotů TurtleBot3 umístěných v oddělených hřištích snažilo dojet do stanovených cílů. Replikovaná metoda nedokázala během vyhodnocování dosáhnout předpokládané úspěšnosti. Byly představeny čtyři úpravy pro zlepšení jejích vlastností a chování. Dvě z nich dokázaly zvýšit úspěšnost při vyhodnocování a dokonce jejich výkony překonaly v dnešní době nejlepší trénovací algoritmus, ačkoliv jejich úspěch nebyl tak výrazný jako úspěch replikované metody v původním článku. This work focused on the use of federated learning in combination with deep reinforcement learning to complete the task of robotic navigation with restrained sensory equipment. An attempt is made to replicate the success of federated learning with the soft weight update, which was introduced in the paper Federated Reinforcement Learning for Collective Navigation of Robotic Swarms. This included the creation of a scenario where several TurtleBot3 robots in independent playgrounds navigated to goals. The replicated method does not reach the expected evaluation performance. Four changes and additions to the method were introduced to improve its behavior. Two propositions enhanced the algorithm performance during evaluation and even managed to outperform other current methods. Although their success was not as significant as the success of the replicated method in the original paper.
Collections
- Bakalářské práce - 13133 [778]
Related items
Showing items related by title, author, creator and subject.
-
Apriorní modely pro rubustní adversariální hluboké učení
Author: Jose Ananias Hilario Reyes; Supervisor: Flach Boris; Opponent: Schlesinger Dmitrij
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2019-06-18)Hluboké sítě naučené standardními metodami diskriminačního učení jsou náchylné k protichůdným vzorům. Výcvik nepřátelsky robustních hlubokých sítí proto vyžaduje nové metody učení. Jednou zajímavou možností je zahrnout ... -
Využití strojového učení v oblasti geodézie a kartografie
Author: Jan Kučera; Supervisor: Pytel Jan; Opponent: Doubrava Petr
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2022-06-22)Tato práce se věnuje tématu strojového učení a jeho možného využití do jiných oblastí jako je geodézie. V první části práce je rozebrána stručná a základní teorie a v části druhé je pak část praktická zaobírající se ... -
Sum-product-set modely pro učení hustot pravděpodobnosti stromových dat
Author: Martin Rektoris; Supervisor: Šmídl Václav; Opponent: Vomlel Jiří
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-01-31)Výzkum a škálovatelnost výzkumu v oblasti strojového učení se urychlily přechodem od ručního vytváření příznaků k automatické extrakci příznaků. Použití datového formátu JSON v různých oblastech, jako je kybernetická ...