Optimalizace sémantického dvojshlukování
Semantic Biclustering Optimization
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Kubelka Petr
Vedoucí práce
Kléma Jiří
Oponent práce
Čermák Jiří
Studijní obor
Informatika a počítačové vědyStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra kybernetikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Dvojshlukování je populární způsob, jak analyzovat data genové exprese, zejména při objevování setů genů, které jsou si funkčně podobné v rámci specifických biologických podmínek. Cílem této bakalářské práce je otestovat a porovnat současný algoritmus sémantického dvojshlukování s novým přístupem. Nová metoda využívá vícekriteriální optimalizace, která implementuje předchozí znalosti o genech a lokacích při hledání dvojshluků na rozdíl od metody současné. Představujeme tři různé přístupy, jak agregovat Pareto množinu řešení do dvojshluku. Tyto Pareto množiny byly získány z modifikace algoritmu využívajícího vícekriteriální optimalizaci. Kvalitu obdržených dvojshluků z Pareto setů ověřujeme jejich následující shrnující schopností popsat neviděná data genové exprese. Biclustering is a popular approach to gene expression data analysis, namely for the discovery of gene sets that are functionally related by specific biological conditions. The purpose of the thesis is to test and compare the current semantic biclustering algorithm with a new approach. The new method uses a multi-criteria optimization that implements prior knowledge of genes and locations in contrast with current semantic biclustering algorithm when searching for biclusters. We propose three different approaches to aggregate a Pareto set solutions into a bicluster. These Pareto sets were obtained from modified multi-criteria optimization algorithm. We evaluate the good quality of acquired biclusters from Pareto sets by their following generalization ability to describe unseen entries of the gene expression dataset.
Kolekce
- Bakalářské práce - 13133 [778]