Stochastické metody propojující neuronové sítě s náhodnými lesy a jejich využití v analýze medicínských dat
Stochastic methods combining neural networks with random forests and their applications to medical data analysis
Typ dokumentu
diplomová prácemaster thesis
Autor
Martin Oharek
Vedoucí práce
Bukáček Marek
Oponent práce
Machlica Lukáš
Studijní obor
Matematické inženýrstvíStudijní program
Aplikace přírodních vědInstituce přidělující hodnost
katedra matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce se zabývá možnou kombinací náhodných rozhodovacích lesů a neuronových sítí, která by dala vzniknout hybridním klasiťikátorům s velkým klasiťikačním potenciálem, využívajících předností obou těchto základních modelů. V práci jsou navrženy čtyři hybridní klasiťikátory, obecně nazývány jako náhodné neuronové lesy, které jsou vytvořeny na základě transformace rozhodovacího stromu na ekvivalentní dopřednou neuronovou sít. Všechny teoretické náležitosti jsou v práci důkladně popsány a schopnost klasiťikace náhodných neuronových lesů je testována na velkém množství klasiťikačních úloh. Důležitou součástí je také analýza parametrů náhodných neuronových lesů a zkoumání jejich vlivu na kvalitu klasiťikace. Závěry jsou podpořeny experimentálně jak na veřejných datových sadách, tak na uměle vytvořených testovacích sadách. Náhodné neuronové lesy jsou mimo jiné testovány na reálné datové sadě zahrnující medicínské záznamy získávané projektem LUCAS. Výstupy experimentů naznačily lepší klasiťikační schopnost náhodných neuronových lesů než u jiných testovaných modelů. This thesis is focused on the potential combination of random forest classiťiers and feedforward neural networks into hybrid classiťiers, which could beneťit from the valuable properties of these two popular machine learning algorithms and could thus possess a strong classiťication ability. We propose four diťferent hybrid classiťiers, generally called neural random forests, which are created on the basis of transformation of a single decision tree into an equivalent feedforward neural network. We provide substantial theoretical background of related domains and verify the classiťication power of neural random forests on numerous classiťication tasks. Moreover, we analyze the eťfect of neural random forest parameters on the overall performance and support the conclusions by evaluating and comparing the performance on public and toy datasets. Additionally, the performance is tested on a real-world dataset, consisting of medical data collected by the LUCAS project. The vast majority of experiments suggested the superiority of the proposed neural random forest models among all tested models.
Kolekce
- Diplomové práce - 14101 [140]