Aktivní adaptivní algoritmická kvantifikace preferencí
Active Adaptive Algorithmic Quantification of Preferences
Typ dokumentu
diplomová prácemaster thesis
Autor
Tereza Siváková
Vedoucí práce
Kárný Miroslav
Oponent práce
Zugarová Eliška
Studijní obor
Aplikované matematicko-stochastické metodyStudijní program
Aplikace přírodních vědInstituce přidělující hodnost
katedra matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato diplomová práce se zabývá dynamickým rozhodováním za použití plně pravděpodobnostního návrhu. Tento návrh modeluje uzavřenou rozhodovací smyčku splňující agentovy preference pomocí \textit{ideální distribuce chování}, která přiřazuje vysoké hodnoty pravděpodobnosti preferovanému chování a malé hodnoty pravděpodobnosti nežádoucímu chování. Následně nalezne optimální rozhodovací politika pomocí minimalizace Kullback-Leiblerovy divergence reálné distribuce chování a ideální distribuce chování. Optimální politika pak vybere v každém kroku, při pozorovaném stavu, uzavřené smyčky, takovou akci, díky které se systém s nejvyšší pravděpodobností posune do preferovaného stavu. V této práci se také zabýváme možností přidání vyvážené preference na volbu akcí. Kromě výše zmíněného se zabýváme zpětnou vazbou agenta na vývoj rozhodování. Agent známkuje známkami od 1 do 5 jako ve škole, jak se mu posloupnost stavů a akcí líbí. Přidáváme optimalizační vrstvu, která nastavuje vrstvu základní tak, aby bylo co nejvíce vyhověno agentovým preferencím vyjádřenými známkami. This thesis studies optimal decision making with the focus on preferences quantified for fully probabilistic design (FPD). FPD introduces the so-called \textit{ideal behaviour distribution}, which has high probability values of preferred behaviour and low probability values of inappropriate behaviours. By minimizing the Kullback-Leibler divergence of the real behaviour distribution and the ideal behaviour distribution an optimal decision policy is found. The policy in every time epoch and for the observed closed-loop state selects the action, thanks to which the system transits to the preferred state with the highest probability.This research also studies preferences targeting actions as well as contradicting preferences. In addition to the above, we deal with the agent's feedback to decision-making. The agent grades the achieved behaviour by marks from 1 to 5 as in school, as he likes the sequence of states and actions. We are adding an optimization closed-loop that tunes the basic closed-loop to meet the agent's preferences expressed by marks as much as possible.
Kolekce
- Diplomové práce - 14101 [152]
Související záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Preference Handling in Relational Query Languages
Autor: Nedbal Radim; Vedoucí práce: Štuller Július; Oponent práce: Vojtáš Peter
(České vysoké učení technické v Praze. Vypočetní a informační centrum., 2011-12-15)A fully declarative and context sensitive language for encoding preferences in database systems is introduced -
Řešení přestupního bodu Limuzská
Autor: Jůza Lukáš; Vedoucí práce: Jareš Martin; Oponent práce: Novotný Vojtěch
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-06-01)Cílem této práce je poukázat na možnost zatraktivnění autobusových linek v oblasti Malešic. S cílem zlepšit provoz autobusových linek byla provedena analýza problémových míst. Na základě analýzy a průzkumu přestupních vazeb ... -
Návrh SSZ na východním výjezdu z Karlova náměstí v Třebíči
Autor: Vacek Jan; Vedoucí práce: Tichý Tomáš; Oponent práce: Šilar Jan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-08-25)Práce nejprve zpracovává dopravní průzkum na zadané křižovatce ve městě Třebíč. Na základě naměřených dat je pak situace hodnocena z pohledu možnosti zřízení světelného signalizačního zařízení na křižovatce. Navrhován je ...