Adaptace CNN klasifikátorů na změny apriorních pravděpodobností
Adaptation of CNN Classifiers to Prior Shift
Type of document
diplomová prácemaster thesis
Author
Tomáš Šipka
Supervisor
Šulc Milan
Opponent
Škoviera Radoslav
Field of study
Počítačové vidění a digitální obrazStudy program
Otevřená informatikaInstitutions assigning rank
katedra kybernetikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
V mnoha klasifikačních úlohách se relativní četnosti tříd (apriorní pravděpodobnosti tříd) na testovací sadě liší od relativních četností během trénování prediktoru. Tento jev, taktéž nazýván \textit{label shift} nebo \textit{prior shift}, může negativně ovlivnit správnost predikcí klasifikátoru. Uvažujeme-li pravděpodobnostní klasifikátor aproximující aposteriorní pravděpodobnosti, mohou být jeho predikce adaptovány na label shift převážením poměrem testovacích a trénovacích apriorních pravděpodobností. Jelikož jsou anotace v testovací sadě obvykle neznámé, musí být poměr apriorních pravděpodobností odhadnut pomocí metody učení bez učitele. Tato teze zhrnuje existující práce řešící adaptaci na label shift. Dále jsou v této práci navrženy nové algoritmy pro odhad nových apriorních pravděpodobností a poměru apriorních pravděpodobností na testovací a trénovací sadě. Navržené metody jsou uzpůsobeny tak, aby řešily známý problém nekonzistentního odhadu pravděpodobnosti rozhodnutí klasifikátoru a jeho confusion matice, jenž může vést k záporným hodnotám v odhadnutých četnostech. Experimentální vyhodnocení ukazuje, že naše metoda zlepšuje stabilitu odhadu apriorních pravděpodobností a přesnost adaptovaného klasifikítoru v porovnání s metodami založenými na confusion matici a současně dosahuje nejlepších výsledků mezi metodami pro prior shift. In many classification tasks, the test set's relative class frequencies (class priors probabilities) differ from the relative class frequencies at training time. Such phenomenon, called \textit{label shift} or \textit{prior shift}, can negatively affect the classifier's performance. Considering a probabilistic classifier approximating posterior probabilities, the predictions can be adapted to the label shift by re-weighting with a ratio of test set and training set priors. Labels in the test set are usually unknown, therefore the prior ratio has to be estimated in an unsupervised manner. This thesis reviews existing methods for adapting probabilistic classifiers to label shift and for estimating test priors in an unlabeled test set. Moreover, we propose novel algorithms to address the problems of estimating new priors and prior ratio. The methods are designed to handle a known issue in confusion matrix-based methods, where inconsistent estimates of decision probabilities and confusion matrices lead to negative values in estimated priors. Experimental evaluation shows that our method improves the stability of prior estimation and the adapted classifier's accuracy compared to the baseline confusion matrix-based methods and achieves state-of-the-art performance in prior shift adaptation.
Collections
- Diplomové práce - 13133 [503]
Related items
Showing items related by title, author, creator and subject.
-
Automatová knihovna - konstrukce LR analyzátoru
Author: Kočička Martin; Supervisor: Trávníček Jan; Opponent: Baier Jan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-05-18)Předmětem této práce jsou základní LR parsovací algoritmy. Práce v úvodu popisuje obecně bottom-up a shift-reduce parsování. Dále se zaměřuje na LR parsování, specificky LR(0) a SLR(1) parsery. Práce obsahuje návrh potřebných ... -
Automatová knihovna - konstrukce LR analyzátoru
Author: Kočička Martin; Supervisor: Trávníček Jan; Opponent: Baier Jan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-05-18)Předmětem této práce jsou základní LR parsovací algoritmy. Práce v úvodu popisuje obecně bottom-up a shift-reduce parsování. Dále se zaměřuje na LR parsování, specificky LR(0) a SLR(1) parsery. Práce obsahuje návrh potřebných ... -
Psychosociální aspekty práce na směny
Author: Kolářová Alžběta; Supervisor: Jirkovská Blanka; Opponent: Emrová Lenka
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2017-05-03)Bakalářská práce se zabývá různými aspekty působícími na život směnného pracovníka. Cílem práce je zjištění aktuální situace pracovníků na směny ve zdravotnickém zařízení z hlediska vlivu na různé aspekty jejich života ...