Zobrazit minimální záznam

Active Adaptive Algorithmic Quantification of Preferences



dc.contributor.advisorKárný Miroslav
dc.contributor.authorTereza Siváková
dc.date.accessioned2022-02-02T00:42:11Z
dc.date.available2022-02-02T00:42:11Z
dc.date.issued2022-01-26
dc.identifierKOS-1131699923605
dc.identifier.urihttp://hdl.handle.net/10467/99355
dc.description.abstractTato diplomová práce se zabývá dynamickým rozhodováním za použití plně pravděpodobnostního návrhu. Tento návrh modeluje uzavřenou rozhodovací smyčku splňující agentovy preference pomocí \textit{ideální distribuce chování}, která přiřazuje vysoké hodnoty pravděpodobnosti preferovanému chování a malé hodnoty pravděpodobnosti nežádoucímu chování. Následně nalezne optimální rozhodovací politika pomocí minimalizace Kullback-Leiblerovy divergence reálné distribuce chování a ideální distribuce chování. Optimální politika pak vybere v každém kroku, při pozorovaném stavu, uzavřené smyčky, takovou akci, díky které se systém s nejvyšší pravděpodobností posune do preferovaného stavu. V této práci se také zabýváme možností přidání vyvážené preference na volbu akcí. Kromě výše zmíněného se zabýváme zpětnou vazbou agenta na vývoj rozhodování. Agent známkuje známkami od 1 do 5 jako ve škole, jak se mu posloupnost stavů a akcí líbí. Přidáváme optimalizační vrstvu, která nastavuje vrstvu základní tak, aby bylo co nejvíce vyhověno agentovým preferencím vyjádřenými známkami.cze
dc.description.abstractThis thesis studies optimal decision making with the focus on preferences quantified for fully probabilistic design (FPD). FPD introduces the so-called \textit{ideal behaviour distribution}, which has high probability values of preferred behaviour and low probability values of inappropriate behaviours. By minimizing the Kullback-Leibler divergence of the real behaviour distribution and the ideal behaviour distribution an optimal decision policy is found. The policy in every time epoch and for the observed closed-loop state selects the action, thanks to which the system transits to the preferred state with the highest probability.This research also studies preferences targeting actions as well as contradicting preferences. In addition to the above, we deal with the agent's feedback to decision-making. The agent grades the achieved behaviour by marks from 1 to 5 as in school, as he likes the sequence of states and actions. We are adding an optimization closed-loop that tunes the basic closed-loop to meet the agent's preferences expressed by marks as much as possible.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectbayesovské odhadovánícze
dc.subjectrozhodovánícze
dc.subjectplně pravděpodobnostní návrhcze
dc.subjectpolitikacze
dc.subjectpreferencecze
dc.subjectBayesian estimationeng
dc.subjectdecision-makingeng
dc.subjectfully probabilistic designeng
dc.subjectpolicyeng
dc.subjectpreferenceeng
dc.subjectpreferenceeng
dc.titleAktivní adaptivní algoritmická kvantifikace preferencícze
dc.titleActive Adaptive Algorithmic Quantification of Preferenceseng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeZugarová Eliška
theses.degree.disciplineAplikované matematicko-stochastické metodycze
theses.degree.grantorkatedra matematikycze
theses.degree.programmeAplikace přírodních vědcze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam