Aktivní adaptivní algoritmická kvantifikace preferencí
Active Adaptive Algorithmic Quantification of Preferences
dc.contributor.advisor | Kárný Miroslav | |
dc.contributor.author | Tereza Siváková | |
dc.date.accessioned | 2022-02-02T00:42:11Z | |
dc.date.available | 2022-02-02T00:42:11Z | |
dc.date.issued | 2022-01-26 | |
dc.identifier | KOS-1131699923605 | |
dc.identifier.uri | http://hdl.handle.net/10467/99355 | |
dc.description.abstract | Tato diplomová práce se zabývá dynamickým rozhodováním za použití plně pravděpodobnostního návrhu. Tento návrh modeluje uzavřenou rozhodovací smyčku splňující agentovy preference pomocí \textit{ideální distribuce chování}, která přiřazuje vysoké hodnoty pravděpodobnosti preferovanému chování a malé hodnoty pravděpodobnosti nežádoucímu chování. Následně nalezne optimální rozhodovací politika pomocí minimalizace Kullback-Leiblerovy divergence reálné distribuce chování a ideální distribuce chování. Optimální politika pak vybere v každém kroku, při pozorovaném stavu, uzavřené smyčky, takovou akci, díky které se systém s nejvyšší pravděpodobností posune do preferovaného stavu. V této práci se také zabýváme možností přidání vyvážené preference na volbu akcí. Kromě výše zmíněného se zabýváme zpětnou vazbou agenta na vývoj rozhodování. Agent známkuje známkami od 1 do 5 jako ve škole, jak se mu posloupnost stavů a akcí líbí. Přidáváme optimalizační vrstvu, která nastavuje vrstvu základní tak, aby bylo co nejvíce vyhověno agentovým preferencím vyjádřenými známkami. | cze |
dc.description.abstract | This thesis studies optimal decision making with the focus on preferences quantified for fully probabilistic design (FPD). FPD introduces the so-called \textit{ideal behaviour distribution}, which has high probability values of preferred behaviour and low probability values of inappropriate behaviours. By minimizing the Kullback-Leibler divergence of the real behaviour distribution and the ideal behaviour distribution an optimal decision policy is found. The policy in every time epoch and for the observed closed-loop state selects the action, thanks to which the system transits to the preferred state with the highest probability.This research also studies preferences targeting actions as well as contradicting preferences. In addition to the above, we deal with the agent's feedback to decision-making. The agent grades the achieved behaviour by marks from 1 to 5 as in school, as he likes the sequence of states and actions. We are adding an optimization closed-loop that tunes the basic closed-loop to meet the agent's preferences expressed by marks as much as possible. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | bayesovské odhadování | cze |
dc.subject | rozhodování | cze |
dc.subject | plně pravděpodobnostní návrh | cze |
dc.subject | politika | cze |
dc.subject | preference | cze |
dc.subject | Bayesian estimation | eng |
dc.subject | decision-making | eng |
dc.subject | fully probabilistic design | eng |
dc.subject | policy | eng |
dc.subject | preference | eng |
dc.subject | preference | eng |
dc.title | Aktivní adaptivní algoritmická kvantifikace preferencí | cze |
dc.title | Active Adaptive Algorithmic Quantification of Preferences | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Zugarová Eliška | |
theses.degree.discipline | Aplikované matematicko-stochastické metody | cze |
theses.degree.grantor | katedra matematiky | cze |
theses.degree.programme | Aplikace přírodních věd | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 14101 [152]