Učení přistávání samořiditelných letadel
Learning to land
Type of document
diplomová prácemaster thesis
Author
Matúš Tóth
Supervisor
Maldonado Lopez Juan Pablo
Opponent
Starosta Štěpán
Field of study
Znalostní inženýrstvíStudy program
InformatikaInstitutions assigning rank
katedra aplikované matematikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Táto práca sa zaoberá problematikou umelej inteligencie zameranej na pristávanie dopravného lietadla Boeing 737-800. Ako simulačné prostredie využíva X-Plane 11 a na základe dát extrahovaných z tohoto simulátora natrénujeme rôzne modely zachytávajúce dynamiku letu počas pristávania. Jednotlivé modely optimalizujeme a porovnávame, ako presne dokážu spomínanú dynamiku reprezentovať. Tieto modely využívame na efektívne natrénovanie agentov pomocou učenia so spätnou väzbou pomocou metódy krížnej entropie využitím troch rôznych odmeňovacích funkcií. Cieľom tohoto trénovania je naučiť agentov s lietadlom pristáť. Agentov optimalizujeme vzhľadom na odmeňovacie funkcie a na záver vyberieme troch elitných agentov, ktorých otestujeme naspäť v prostredí X-Plane. Výstupom je zhodnotenie ako úspešní elitní agenti sú vzhľadom na podmienky bezpečného a stabilizovaného pristátia a vyvodenie záveru, či by umelá inteligencia mohla nahradiť pilota. This work is concerned with the issue of autonomous landing of airliner Boeing 737-800. As the simulation environment, X-Plane 11 is used, and based on the data obtained from this simulator, we develop various models capturing flight dynamics during landing. We optimize each model and compare how accurately they represent the dynamics. These models are utilized for training policy effectively using reinforcement learning algorithm with cross entropy method and three different reward functions. The aim of this training is to teach the aircraft to land. The agents are optimized according to reward functions and in the end we select three elite agents that we test back in the X-Plane environment. The outcome of this evaluation is how successful the elite agents are with regard to the conditions of safe and stabilized approach and conclusion, whether the pilot could be replaced by the artificial intelligence.
Collections
- Diplomové práce - 18105 [203]