Aktivní adaptivní algoritmická kvantifikace preferencí

Tereza Siváková

Active Adaptive Algorithmic Quantification of Preferences

dc.contributor.advisor	Kárný Miroslav
dc.contributor.author	Tereza Siváková
dc.date.accessioned	2022-02-02T00:42:11Z
dc.date.available	2022-02-02T00:42:11Z
dc.date.issued	2022-01-26
dc.identifier	KOS-1131699923605
dc.identifier.uri	http://hdl.handle.net/10467/99355
dc.description.abstract	Tato diplomová práce se zabývá dynamickým rozhodováním za použití plně pravděpodobnostního návrhu. Tento návrh modeluje uzavřenou rozhodovací smyčku splňující agentovy preference pomocí \textit{ideální distribuce chování}, která přiřazuje vysoké hodnoty pravděpodobnosti preferovanému chování a malé hodnoty pravděpodobnosti nežádoucímu chování. Následně nalezne optimální rozhodovací politika pomocí minimalizace Kullback-Leiblerovy divergence reálné distribuce chování a ideální distribuce chování. Optimální politika pak vybere v každém kroku, při pozorovaném stavu, uzavřené smyčky, takovou akci, díky které se systém s nejvyšší pravděpodobností posune do preferovaného stavu. V této práci se také zabýváme možností přidání vyvážené preference na volbu akcí. Kromě výše zmíněného se zabýváme zpětnou vazbou agenta na vývoj rozhodování. Agent známkuje známkami od 1 do 5 jako ve škole, jak se mu posloupnost stavů a akcí líbí. Přidáváme optimalizační vrstvu, která nastavuje vrstvu základní tak, aby bylo co nejvíce vyhověno agentovým preferencím vyjádřenými známkami.	cze
dc.description.abstract	This thesis studies optimal decision making with the focus on preferences quantified for fully probabilistic design (FPD). FPD introduces the so-called \textit{ideal behaviour distribution}, which has high probability values of preferred behaviour and low probability values of inappropriate behaviours. By minimizing the Kullback-Leibler divergence of the real behaviour distribution and the ideal behaviour distribution an optimal decision policy is found. The policy in every time epoch and for the observed closed-loop state selects the action, thanks to which the system transits to the preferred state with the highest probability.This research also studies preferences targeting actions as well as contradicting preferences. In addition to the above, we deal with the agent's feedback to decision-making. The agent grades the achieved behaviour by marks from 1 to 5 as in school, as he likes the sequence of states and actions. We are adding an optimization closed-loop that tunes the basic closed-loop to meet the agent's preferences expressed by marks as much as possible.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	bayesovské odhadování	cze
dc.subject	rozhodování	cze
dc.subject	plně pravděpodobnostní návrh	cze
dc.subject	politika	cze
dc.subject	preference	cze
dc.subject	Bayesian estimation	eng
dc.subject	decision-making	eng
dc.subject	fully probabilistic design	eng
dc.subject	policy	eng
dc.subject	preference	eng
dc.subject	preference	eng
dc.title	Aktivní adaptivní algoritmická kvantifikace preferencí	cze
dc.title	Active Adaptive Algorithmic Quantification of Preferences	eng
dc.type	diplomová práce	cze
dc.type	master thesis	eng
dc.contributor.referee	Zugarová Eliška
theses.degree.discipline	Aplikované matematicko-stochastické metody	cze
theses.degree.grantor	katedra matematiky	cze
theses.degree.programme	Aplikace přírodních věd	cze

Soubory tohoto záznamu

Název:: F4-DP-2022-Sivakova-Tereza-dp_ ...
Velikost:: 2.373Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F4-DP-2022-posudek-Zugarova_El ...
Velikost:: 32.57Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F4-DP-2022-posudek-Karny_Miros ...
Velikost:: 281.7Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Diplomové práce - 14101 [152]

Zobrazit minimální záznam

Aktivní adaptivní algoritmická kvantifikace preferencí

Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Související záznamy

Preference Handling in Relational Query Languages ﻿

Řešení přestupního bodu Limuzská ﻿

Návrh SSZ na východním výjezdu z Karlova náměstí v Třebíči ﻿

Preference Handling in Relational Query Languages

Řešení přestupního bodu Limuzská

Návrh SSZ na východním výjezdu z Karlova náměstí v Třebíči