Bezpečné autonomní posilované učení

Martin Pecka

Safe Autonomous Reinforcement Learning

Typ dokumentu

disertační práce
doctoral thesis

Autor

Martin Pecka

Vedoucí práce

Svoboda Tomáš

Oponent práce

Piater Justus

Studijní obor

Umělá inteligence a biokybernetika

Studijní program

Elektrotechnika a informatika

Instituce přidělující hodnost

vidění pro roboty a autonomní systémy

Práva

A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html

Metadata

Zobrazit celý záznam

Abstrakt

Technika posilovaného učení již nesčetněkrát prokázala svou užitečnost v robotice a dalších aplikacích strojového učení. Dovoluje učit strategie řízení robotů bez přesné znalosti, jaká akce je ve kterém stavu ideální. K nalezení optimální strategie stačí dodat funkci užitku a několikrát systém spustit.

Reinforcement Learning is a technique proven by uncountable use-cases in the robotics community and many other machine-learning fields. It allows training optimal decision policies without knowing precisely which actions are the best at any given moment. A reward function and some number of policy rollouts suffice to estimate the best decision policy.