Adjustment for the Confounding Factor Influence in the RNASeq Data Classification
Kompenzace vlivu matoucích faktorů při klasifikaci RNASeq dat
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
Abstract
Analýza dat genové exprese slouží významným zdrojem informace o chování biologických systémů. Jednou z cest jak tuto informaci získat je kvantifikování a měření genové exprese pomocí technologie RNA sekvenování (RNA-Seq). V lékařských studiích však často existují omezení, spojené například s etickými důvody nebo se vzácnosti některých onemocnění. Není proto vždy možné ve studiích zkoumat randomizované skupiny s dostatečným počtem pacientů pro řádné posouzení sledovaného vztahu. Vznikají tak tzv. matoucí faktory, které mohou výsledky studií zkreslovat. Tato práce stručně seznamuje s technologií RNA sekvenování a popisuje základní vlastnosti získávaných touto technologií dat. Dále práce pojednává o problematice matoucích faktorů a představuje rešerši metod pro kompenzaci jejich vlivu. Zvolená metoda pak bude aplikována při klasifikaci poskytnutých a uměle generovaných RNA-Seq dat, na základě čehož bude vyhodnocena její použitelnost.
Analysis of gene expression data serves as an essential source of information about the behavior of biological systems. One way to obtain this information is to quantify and measure gene expression using RNA sequencing (RNA-Seq) technology. However, there can often be limitations in medical studies due to ethical considerations or the rarity of certain diseases. Therefore, it is sometimes impossible to examine well-randomized groups with sufficient patients to assess the observed relationship properly. It causes the appearance of confounding factors that may bias the results of studies. This thesis briefly introduces RNA sequencing technology and describes the basic properties of the RNA-Seq data. Furthermore, the thesis discusses the issue of confounding factors and presents a survey of methods to adjust for their influence. The selected method will then be applied in the classification of real and artificially generated RNA-Seq data, which will evaluate the applicability of the suggested method.
Analysis of gene expression data serves as an essential source of information about the behavior of biological systems. One way to obtain this information is to quantify and measure gene expression using RNA sequencing (RNA-Seq) technology. However, there can often be limitations in medical studies due to ethical considerations or the rarity of certain diseases. Therefore, it is sometimes impossible to examine well-randomized groups with sufficient patients to assess the observed relationship properly. It causes the appearance of confounding factors that may bias the results of studies. This thesis briefly introduces RNA sequencing technology and describes the basic properties of the RNA-Seq data. Furthermore, the thesis discusses the issue of confounding factors and presents a survey of methods to adjust for their influence. The selected method will then be applied in the classification of real and artificially generated RNA-Seq data, which will evaluate the applicability of the suggested method.
Description
Citation
Underlying research data set URL
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.