Porovnání směrových a asociativních metod na single-cell RNA sekvenčních datech
Evaluating Directional and Association Methods on Single-cell RNA Sequencing Data
Typ dokumentu
diplomová prácemaster thesis
Autor
Eliška Dvořáková
Vedoucí práce
Song Joe
Oponent práce
Kléma Jiří
Studijní obor
BioinformatikaStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce je zaměřena na porovnání a vyhodnocení směrových a asociativních metod na \textit{single-cell RNA} sekvenčních (scRNA-seq) datech. ScRNA-seq umožňuje studovat biologii na jednobuněčné úrovni. Přestože tento proces RNA sekvenování otevírá nové možnosti, data můžou podléhat technickému zkreslení jakým je výpadek informace s mírou ztráty pohybující se od 30 do 90 \%. Proto metody, které fungovaly spolehlivě pro \textit{bulk RNA} data, dávají výsledky blízké náhodnému odhadování pro scRNA-seq. Proto představuji porovnání několika metod na simulovaných i reálných datech. Směrové a nesměrové studie jsou rozděleny pro testy na simulovaných datech, aby se předešlo ovlivnění výsledků metodami, které predikují špatně jen pro jednu z těchto studií. Metoda s nejlepším vyhodnocením je následně použita pro objevení nových vzorů přes transkriptom a proteom v buňkách akutní leukémie. Za druhé, demonstruji dopad normalizace dat na asociativní metody. Čtyři současné normalizační metody a nový přístup představený zde jsou porovnány na reálných datech. Funkce jsou testovány na tvorbu nových artefaktů a destrukci původních artefaktů. Příklady těchto vzorových přeměn jsou poskytnuté pro všechny postupy. Výsledky této práce naznačují, že normalizace scRNA-seq dat musí být pečlivě zpracována, aby se zabránilo zavádění nežádoucích artefaktů do studie vztahů mezi geny. This thesis aims to compare and evaluate directional and association methods performance on single-cell RNA sequencing (\textit{scRNA-seq}) data. The scRNA-seq enables one to study biology at a single cell resolution. Although this process of RNA sequencing opens up new possibilities, the data can be subject to technical distortions, such as a dropout where the loss of information ranges from 30 to 90 \%. Thus methods that work reliably for the bulk RNA data sets may perform close to random guessing for the scRNA-seq. Therefore I present a comparison of multiple methods on both the simulated and the real data sets. The directional and non-directional studies are separated for tests using the simulated data to prevent influencing the results by methods that detect the inference inaccurately in only one of these studies. The best performing method is then used to discover new association patterns across transcriptome and proteome in acute leukaemia cells. Secondly, I demonstrate the impact of data normalisation for association methods. Four current normalisation methods and a new approach proposed here are compared on real data. The functions are tested for a new artefact creation and the original artefact destruction. Examples of these pattern transformations are provided for each approach. The findings in this thesis suggest that the normalisation of the scRNA-seq data must be carefully handled to avoid introducing undesirable artefacts into the studying of relationships between genes.
Kolekce
- Diplomové práce - 13136 [892]