Aktivní adaptivní algoritmická kvantifikace preferencí
Active Adaptive Algorithmic Quantification of Preferences
Type of document
diplomová prácemaster thesis
Author
Tereza Siváková
Supervisor
Kárný Miroslav
Opponent
Zugarová Eliška
Field of study
Aplikované matematicko-stochastické metodyStudy program
Aplikace přírodních vědInstitutions assigning rank
katedra matematikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Tato diplomová práce se zabývá dynamickým rozhodováním za použití plně pravděpodobnostního návrhu. Tento návrh modeluje uzavřenou rozhodovací smyčku splňující agentovy preference pomocí \textit{ideální distribuce chování}, která přiřazuje vysoké hodnoty pravděpodobnosti preferovanému chování a malé hodnoty pravděpodobnosti nežádoucímu chování. Následně nalezne optimální rozhodovací politika pomocí minimalizace Kullback-Leiblerovy divergence reálné distribuce chování a ideální distribuce chování. Optimální politika pak vybere v každém kroku, při pozorovaném stavu, uzavřené smyčky, takovou akci, díky které se systém s nejvyšší pravděpodobností posune do preferovaného stavu. V této práci se také zabýváme možností přidání vyvážené preference na volbu akcí. Kromě výše zmíněného se zabýváme zpětnou vazbou agenta na vývoj rozhodování. Agent známkuje známkami od 1 do 5 jako ve škole, jak se mu posloupnost stavů a akcí líbí. Přidáváme optimalizační vrstvu, která nastavuje vrstvu základní tak, aby bylo co nejvíce vyhověno agentovým preferencím vyjádřenými známkami. This thesis studies optimal decision making with the focus on preferences quantified for fully probabilistic design (FPD). FPD introduces the so-called \textit{ideal behaviour distribution}, which has high probability values of preferred behaviour and low probability values of inappropriate behaviours. By minimizing the Kullback-Leibler divergence of the real behaviour distribution and the ideal behaviour distribution an optimal decision policy is found. The policy in every time epoch and for the observed closed-loop state selects the action, thanks to which the system transits to the preferred state with the highest probability.This research also studies preferences targeting actions as well as contradicting preferences. In addition to the above, we deal with the agent's feedback to decision-making. The agent grades the achieved behaviour by marks from 1 to 5 as in school, as he likes the sequence of states and actions. We are adding an optimization closed-loop that tunes the basic closed-loop to meet the agent's preferences expressed by marks as much as possible.
Collections
- Diplomové práce - 14101 [152]
Related items
Showing items related by title, author, creator and subject.
-
Preference Handling in Relational Query Languages
Author: Nedbal Radim; Supervisor: Štuller Július; Opponent: Vojtáš Peter
(České vysoké učení technické v Praze. Vypočetní a informační centrum., 2011-12-15)A fully declarative and context sensitive language for encoding preferences in database systems is introduced -
Řešení přestupního bodu Limuzská
Author: Jůza Lukáš; Supervisor: Jareš Martin; Opponent: Novotný Vojtěch
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-06-01)Cílem této práce je poukázat na možnost zatraktivnění autobusových linek v oblasti Malešic. S cílem zlepšit provoz autobusových linek byla provedena analýza problémových míst. Na základě analýzy a průzkumu přestupních vazeb ... -
Návrh SSZ na východním výjezdu z Karlova náměstí v Třebíči
Author: Vacek Jan; Supervisor: Tichý Tomáš; Opponent: Šilar Jan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-08-25)Práce nejprve zpracovává dopravní průzkum na zadané křižovatce ve městě Třebíč. Na základě naměřených dat je pak situace hodnocena z pohledu možnosti zřízení světelného signalizačního zařízení na křižovatce. Navrhován je ...