This thesis summarizes main results of the author obtained in the field called “small area
estimation” (SAE). SAE is a branch of mathematical statistics which deals with the problem
of estimating population parameters in subsets (called areas or domains) of a population where
the sample sizes are not large enough to provide reliable direct estimates. For this purpose, SAE
introduces statistical models that “borrow strength” from related small areas, data from external
administrative sources or data from different time periods. An overview of basic principles,
models and problems encountered in SAE is given in the first part of the thesis.
The contribution of the author in the form of published papers is presented in the second part
of the thesis and consists of several models proposed for estimation of small area parameters.
These models are based on linear mixed and generalized linear mixed models. Namely, there are
proposed and studied several modifications of Fay-Herriot and nested error regression models
and there are considered logistic mixed models for binary data. For all the assumed models
the following problems are treated. Formulas and algorithms for estimation of the unknown
parameters of the models are derived. Model-based empirical best predictors of parameters of
small areas are studied. Special attention is paid to estimation of the mean squared error of
the predictors since such a measure of accuracy is needed in practical applications. For all the
models analytic approximation or bootstrap estimates of the mean squared errors are given.
An important part of developing a new model is to design and carry out simulation experi ments studying small sample size behaviour of the new methods and comparing them with the
existing ones if there are any available. It means that development of non-trivial software tools
is an integral part of the presented works since the standard statistical packages cannot be used
for the studied models and moreover Monte Carlo approximation methods must often be used.
Further, to show applicability and benefits of the proposed methods in practice, a real data
application are performed in all the papers.
In addition, several results of the author which are connected with robust estimation and
outlier detection in generalized linear models and which can be applied to small area estimation
problems are presented.
cze
dc.language.iso
en
en
dc.publisher
ČVUT. Fakulta jaderná a fyzikálně inženýrská.
cze
dc.title
Model-based methods for small area estimation
en
dc.type
habilitation thesis
cze
dc.type
habilitační práce
dc.description.abstract-translated
Tato práce shrnuje hlavní výsledky autora získané v tematice zvané „odhadování v malých
oblastech“ (anglicky „small area estimation“ - SAE). SAE je odvětví matematické statistiky,
které se zabývá odhadováním parametrů v podmnožinách (nazývaných oblasti nebo domény)
jisté populace, ve kterých není k dispozici dostatečné množství dat pro spolehlivé přímé odhady.
Za tímto účelem zavádí SAE modely, které si „půjčují sílu“ ze souvisejících malých oblastí, z
dat získaných z externích administrativních zdrojů nebo z dat z jiných časových období. Přehled
základních principů, modelů a problémů vyskytujících se v SAE je obsahem první části práce.
Příspěvek autora k této problematice je ve formě publikovaných článků prezentován ve druhé
části práce a spočívá v několika modelech navržených pro odhadování parametrů malých oblastí.
Tyto modely jsou založeny na lineárních smíšených a zobecněných lineárních smíšených mode lech. Konkrétně je navrženo a studováno několik modifikací Fay-Herriotova modelu a regresního
modelu se vnořenými chybami a dále jsou uvažovány logistické smíšené modely pro binární
data. Pro všechny uvažované modely jsou řešeny následující problémy. Jsou odvozeny formule
a algoritmy pro odhadování neznámých parametrů modelu. Jsou studovány empirické nejlepší
prediktory parametrů malých oblastí založené na studovaných modelech. Zvláštní pozornost je
věnována odhadům střední kvadratické chyby prediktorů, neboť takováto míra přesnosti je potřebná pro praktické aplikace. Pro všechny modely jsou popsány analytické aproximace středních
kvadratických chyb nebo jejich odhady pomocí metody bootstrap.
Důležitou součástí vytváření nového modelu je návrh a realizace simulačních experimentů
studujících chování nových metod pro malé rozsahy výběrů a porovnávající je s již existujícími
metodami, pokud nějaké jsou. Nedílnou součástí prezentovaných prací je tedy vývoj netriviálních softwarových nástrojů, neboť standardní statistické balíky nelze pro studované modely
použít a navíc je třeba často použít aproximace pomocí metody Monte Carlo. Aby byla ukázána
aplikovatelnost a přínos navržených metod v praxi, je ve všech článcích provedena aplikace na
reálná data.
Závěrem je uvedeno několik výsledků autora, týkajících se robustního odhadování a detekce
odlehlých pozorování v zobecněných lineárních modelech, které mohou být aplikovány na problémy odhadování v malých oblastech.