Kompenzace vlivu matoucích faktorů při klasifikaci RNASeq dat
Adjustment for the Confounding Factor Influence in the RNASeq Data Classification
Type of document
bakalářská prácebachelor thesis
Author
Karina Balagazova
Supervisor
Kléma Jiří
Opponent
Hrubá Petra
Field of study
Základy umělé inteligence a počítačových vědStudy program
Otevřená informatikaInstitutions assigning rank
katedra kybernetikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Analýza dat genové exprese slouží významným zdrojem informace o chování biologických systémů. Jednou z cest jak tuto informaci získat je kvantifikování a měření genové exprese pomocí technologie RNA sekvenování (RNA-Seq). V lékařských studiích však často existují omezení, spojené například s etickými důvody nebo se vzácnosti některých onemocnění. Není proto vždy možné ve studiích zkoumat randomizované skupiny s dostatečným počtem pacientů pro řádné posouzení sledovaného vztahu. Vznikají tak tzv. matoucí faktory, které mohou výsledky studií zkreslovat. Tato práce stručně seznamuje s technologií RNA sekvenování a popisuje základní vlastnosti získávaných touto technologií dat. Dále práce pojednává o problematice matoucích faktorů a představuje rešerši metod pro kompenzaci jejich vlivu. Zvolená metoda pak bude aplikována při klasifikaci poskytnutých a uměle generovaných RNA-Seq dat, na základě čehož bude vyhodnocena její použitelnost. Analysis of gene expression data serves as an essential source of information about the behavior of biological systems. One way to obtain this information is to quantify and measure gene expression using RNA sequencing (RNA-Seq) technology. However, there can often be limitations in medical studies due to ethical considerations or the rarity of certain diseases. Therefore, it is sometimes impossible to examine well-randomized groups with sufficient patients to assess the observed relationship properly. It causes the appearance of confounding factors that may bias the results of studies. This thesis briefly introduces RNA sequencing technology and describes the basic properties of the RNA-Seq data. Furthermore, the thesis discusses the issue of confounding factors and presents a survey of methods to adjust for their influence. The selected method will then be applied in the classification of real and artificially generated RNA-Seq data, which will evaluate the applicability of the suggested method.
Collections
- Bakalářské práce - 13133 [636]