Semantic Biclustering Optimization
Optimalizace sémantického dvojshlukování
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
Abstract
Dvojshlukování je populární způsob, jak analyzovat data genové exprese, zejména při objevování setů genů, které jsou si funkčně podobné v rámci specifických biologických podmínek. Cílem této bakalářské práce je otestovat a porovnat současný algoritmus sémantického dvojshlukování s novým přístupem. Nová metoda využívá vícekriteriální optimalizace, která implementuje předchozí znalosti o genech a lokacích při hledání dvojshluků na rozdíl od metody současné. Představujeme tři různé přístupy, jak agregovat Pareto množinu řešení do dvojshluku. Tyto Pareto množiny byly získány z modifikace algoritmu využívajícího vícekriteriální optimalizaci. Kvalitu obdržených dvojshluků z Pareto setů ověřujeme jejich následující shrnující schopností popsat neviděná data genové exprese.
Biclustering is a popular approach to gene expression data analysis, namely for the discovery of gene sets that are functionally related by specific biological conditions. The purpose of the thesis is to test and compare the current semantic biclustering algorithm with a new approach. The new method uses a multi-criteria optimization that implements prior knowledge of genes and locations in contrast with current semantic biclustering algorithm when searching for biclusters. We propose three different approaches to aggregate a Pareto set solutions into a bicluster. These Pareto sets were obtained from modified multi-criteria optimization algorithm. We evaluate the good quality of acquired biclusters from Pareto sets by their following generalization ability to describe unseen entries of the gene expression dataset.
Biclustering is a popular approach to gene expression data analysis, namely for the discovery of gene sets that are functionally related by specific biological conditions. The purpose of the thesis is to test and compare the current semantic biclustering algorithm with a new approach. The new method uses a multi-criteria optimization that implements prior knowledge of genes and locations in contrast with current semantic biclustering algorithm when searching for biclusters. We propose three different approaches to aggregate a Pareto set solutions into a bicluster. These Pareto sets were obtained from modified multi-criteria optimization algorithm. We evaluate the good quality of acquired biclusters from Pareto sets by their following generalization ability to describe unseen entries of the gene expression dataset.
Description
Citation
Underlying research data set URL
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.