Využití metylačních dat v molekulárních modelech fenotypu
Utilization of methylation data in phenotype molecular models
Typ dokumentu
diplomová prácemaster thesis
Autor
Yusupov Mukhiddin
Vedoucí práce
Kléma Jiří
Oponent práce
Pošík Petr
Studijní obor
Umělá inteligenceStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Zobrazit celý záznamAbstrakt
Nedávný technologický rozvoj umožnil systematické využití apriorní znablosti v biologickém výzkumu. Cílem je hlubší vhled do podstaty biologických procesů. Jednou z nejčastějších oblastí využití znalostních přístupů je oblast tvorby fenotypových molekulárních modelů, kdy fenotyp často odpovídá různým typům a stupňům konkrétní nemoci. Dřívější úspěšné studie byly založeny zejména na statistickém učení založeném na profilech genové exprese (GE). Pozdější práce ukázaly, že i DNA metylační (DNAm) data přinášejí novou informaci a mohou být jedním z hlavních faktorů GE regulace. V této práci se zaměřujeme na konkrétní data pacientů s myleodysplastickým syndromem (MDS). Navrhujeme prediktivní model, který integruje DNAm s GE daty s cílem vylepšit prediktivní přesnost MDS klasifikátoru, popřípadě nalézt konkrétní prediktivní signatury. Porovnáváme dva typy integrace DNAm s GE daty. První je slepá, tj. neinformovaná, druhá je založená na znalostech interakcí mezi oběma typy dat. V práci demonstrujeme, že DNAm data napomáhají zvýšení přesnosti MDS klasifikace. Dále ukazujeme, že jak GE, tak i DNAm data, generují užitečné prediktivní vzory a znalostní modely svou přesností překonávají zbylé přístupy. Recent advances in technology have allowed scientists to conduct research in a systematic way by incorporating additional knowledge and to gain deeper insight on various biological processes in a domain of their study. One of the active research works where a great demand on the knowledge integration based approaches can be observed is the construction of phenotype molecular models or in particular biomedical disease models. Several studies have successfully applied statistical learning techniques by using gene expression (GE) profiles for building phenotype classification models. A lot of other works showed that DNA methylation (DNAm) brings new information and can be the main factor of GE regulation. Focusing on a dataset of patients with Myelodysplastic Syndrome (MDS) disease, we propose a prediction model that integrates DNAm with GE data in order to discover new signatures and improve the classification performance. Two types of integration, blind and smart integration, were employed and their performances were compared in the work. We show that for most of the disease associated treatment response types integration of DNAm improves the predictive power. We demonstrate that both GE and DNAm profiles contain specific patterns that contribute to classification of phenotype and the model with knowledge based integration outperforms the remaining models.
Kolekce
- Diplomové práce - 13136 [892]