Možnosti využití kaskád neuronových sítí pro klasifikaci krvetvorných buněk
Neural Network Cascades to Incorporate Domain Knowledge for Hematopoietic Cell Classification
Type of document
diplomová prácemaster thesis
Author
Jonas Daniel Nienhaus
Supervisor
Havlík Jan
Opponent
Kybic Jan
Field of study
BioinformatikaStudy program
Lékařská elektronika a bioinformatikaInstitutions assigning rank
katedra počítačůRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Předložená práce se zabývá hierarchickou klasifikací hematopoetických buněk s využitím kaskád hlubokých neuronových sítí. V práci jsou definovány dvě strategie pro získání kombinovaných předpovědí z kaskád, pravděpodobnostní přístup a deterministická metoda. I když se obě metody teoreticky liší, vedou v praxi k velmi podobným výsledkům. Hierarchické kaskády lze trénovat buď samostatně pro každou jednotlivou síť, nebo jako end-to-end celek. Ukazuje se, že individuální trénink je výhodnější jak z hlediska dosaženého výkonu, tak z hlediska flexibility. Pro řízení procesu klasifikace jsou definovány různé posloupnosti, buď orientované na biologické buněčné linie, na určité rysy a vlastnosti, nebo za účelem kompenzace nerovnováhy tříd v datové sadě. Vyhodnocováno je několik metod a optimalizačních technik, včetně možnosti pro určité dílčí úkoly, kde mají třídy pořadový znak, využít regresory místo klasifikátorů. Obecně se ukazuje, že u vhodných hierarchických struktur lze dosáhnout podobných výsledků klasifikace jako u separátních sítí. Zejména předtrénování separátních sítí na vybrané datové sadě pak přináší zlepšení dosažených výsledků. Hlavní výhodou kaskád je zvýšená modularita a fakt, že poskytují další informace ve srovnání s jednotlivými sítěmi. Díky předávání vlastností, tedy metodě umožňující vkládání vektorů do kaskád a jejich předávání do navazujících sítí, lze získané vlastnosti vizualizovat nejen pro celý model, ale také na mezilehlých úrovních. In this work, classification of haematopoietic cells is performed hierarchically, employing cascades of deep neural networks. Two strategies are defined to obtain combined predictions from the cascades, a probabilistic approach and a greedy, deterministic method. Although different in theory, both strategies lead to very similar outcomes in practice. Hierarchical cascades can be trained either separately for each network or end-to-end as a whole. It is shown that the individual training is preferable both in terms of achieved performance as well as flexibility. Different hierarchies are defined to guide the classification process, either oriented on the biological cell lineages, on certain features and characteristics, or in order to compensate for class imbalance in the dataset. Several methods and optimisation techniques are evaluated, including the possibility to incorporate regressors instead of classifiers for certain sub-tasks where the classes have an ordinal character. In general, it is shown that, for appropriate hierarchies, similar classification performances as with single networks can be achieved. Especially pretraining of the individual networks on the target dataset yields improvements. The main advantage of the cascades is an increased modularity as well as additional information compared to single networks. With feature forwarding, a method introducing embedding vectors into the cascades and passing them to subsequent networks, the learnt feature space can be visualised not only for the entire model, but also at intermediate levels.
Collections
- Diplomové práce - 13136 [892]