Model-based methods for small area estimation

Hobza, Tomáš

dc.contributor.author	Hobza, Tomáš
dc.date.accessioned	2024-05-02T12:37:07Z
dc.date.available	2024-05-02T12:37:07Z
dc.date.issued	2017
dc.identifier.uri	http://hdl.handle.net/10467/114348
dc.description.abstract	This thesis summarizes main results of the author obtained in the field called “small area estimation” (SAE). SAE is a branch of mathematical statistics which deals with the problem of estimating population parameters in subsets (called areas or domains) of a population where the sample sizes are not large enough to provide reliable direct estimates. For this purpose, SAE introduces statistical models that “borrow strength” from related small areas, data from external administrative sources or data from different time periods. An overview of basic principles, models and problems encountered in SAE is given in the first part of the thesis. The contribution of the author in the form of published papers is presented in the second part of the thesis and consists of several models proposed for estimation of small area parameters. These models are based on linear mixed and generalized linear mixed models. Namely, there are proposed and studied several modifications of Fay-Herriot and nested error regression models and there are considered logistic mixed models for binary data. For all the assumed models the following problems are treated. Formulas and algorithms for estimation of the unknown parameters of the models are derived. Model-based empirical best predictors of parameters of small areas are studied. Special attention is paid to estimation of the mean squared error of the predictors since such a measure of accuracy is needed in practical applications. For all the models analytic approximation or bootstrap estimates of the mean squared errors are given. An important part of developing a new model is to design and carry out simulation experi ments studying small sample size behaviour of the new methods and comparing them with the existing ones if there are any available. It means that development of non-trivial software tools is an integral part of the presented works since the standard statistical packages cannot be used for the studied models and moreover Monte Carlo approximation methods must often be used. Further, to show applicability and benefits of the proposed methods in practice, a real data application are performed in all the papers. In addition, several results of the author which are connected with robust estimation and outlier detection in generalized linear models and which can be applied to small area estimation problems are presented.	cze
dc.language.iso	en	en
dc.publisher	ČVUT. Fakulta jaderná a fyzikálně inženýrská.	cze
dc.title	Model-based methods for small area estimation	en
dc.type	habilitation thesis	cze
dc.type	habilitační práce
dc.description.abstract-translated	Tato práce shrnuje hlavní výsledky autora získané v tematice zvané „odhadování v malých oblastech“ (anglicky „small area estimation“ - SAE). SAE je odvětví matematické statistiky, které se zabývá odhadováním parametrů v podmnožinách (nazývaných oblasti nebo domény) jisté populace, ve kterých není k dispozici dostatečné množství dat pro spolehlivé přímé odhady. Za tímto účelem zavádí SAE modely, které si „půjčují sílu“ ze souvisejících malých oblastí, z dat získaných z externích administrativních zdrojů nebo z dat z jiných časových období. Přehled základních principů, modelů a problémů vyskytujících se v SAE je obsahem první části práce. Příspěvek autora k této problematice je ve formě publikovaných článků prezentován ve druhé části práce a spočívá v několika modelech navržených pro odhadování parametrů malých oblastí. Tyto modely jsou založeny na lineárních smíšených a zobecněných lineárních smíšených mode lech. Konkrétně je navrženo a studováno několik modifikací Fay-Herriotova modelu a regresního modelu se vnořenými chybami a dále jsou uvažovány logistické smíšené modely pro binární data. Pro všechny uvažované modely jsou řešeny následující problémy. Jsou odvozeny formule a algoritmy pro odhadování neznámých parametrů modelu. Jsou studovány empirické nejlepší prediktory parametrů malých oblastí založené na studovaných modelech. Zvláštní pozornost je věnována odhadům střední kvadratické chyby prediktorů, neboť takováto míra přesnosti je potřebná pro praktické aplikace. Pro všechny modely jsou popsány analytické aproximace středních kvadratických chyb nebo jejich odhady pomocí metody bootstrap. Důležitou součástí vytváření nového modelu je návrh a realizace simulačních experimentů studujících chování nových metod pro malé rozsahy výběrů a porovnávající je s již existujícími metodami, pokud nějaké jsou. Nedílnou součástí prezentovaných prací je tedy vývoj netriviálních softwarových nástrojů, neboť standardní statistické balíky nelze pro studované modely použít a navíc je třeba často použít aproximace pomocí metody Monte Carlo. Aby byla ukázána aplikovatelnost a přínos navržených metod v praxi, je ve všech článcích provedena aplikace na reálná data. Závěrem je uvedeno několik výsledků autora, týkajících se robustního odhadování a detekce odlehlých pozorování v zobecněných lineárních modelech, které mohou být aplikovány na problémy odhadování v malých oblastech.

Soubory tohoto záznamu

Název:: Priloha1_HP_Tomas Hobza.pdf
Velikost:: 451.1Kb
Formát:: PDF
: Zobrazit/otevřít

Název:: license.txt
Velikost:: 1.707Kb
Formát:: Textový soubor
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Habilitační práce - 14000 [46]

Zobrazit minimální záznam