Inference interakčních sítí z multi-omických dat pomocí bayesovských sítí
Inference of interaction networks from multi-omics data using Bayesian networks
Type of document
diplomová prácemaster thesis
Author
Alikhan Anuarbekov
Supervisor
Kléma Jiří
Opponent
Drchal Jan
Field of study
BioinformatikaStudy program
Otevřená informatikaInstitutions assigning rank
katedra počítačůRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
V nedávném článku byla představena metoda circGPA pro efektivní anotaci cirkulárních RNA z jejich interakční sítě. Cirkulární RNA s dosud neznámou funkcí jsou anotovány ontologickými termy na základě předpokladu, že interagující RNA se známou anotací mají příbuznou funkci a tím i anotaci. Jedním z omezení navržené metody bylo to, že interakční síť byla konstruována pouze ze předem známých databazových interakcí. Ty nemusejí být v konkretních experimentálních podminkách aktivní. V této diplomové práci je představeno potenciální řešení tohoto problému - kombinace empirických expresních, t.j. experimentálních dat, se znamými interakcemi z databazí pomocí algoritmu učení bayesovských sítí. Jako první model byl použit algoritmus IntOMICS. Bylo však zjištěno, že IntOMICS se pro naše experimentální data a circRNA interakční sítě dané velikosti nehodí a jsou potřeba jeho modifikace. Pomocí těchto modifikací bylo dosaženo dílčích zlepšení výpočtu horní meze pravděpodobnostního ohodnocení interakčních sítí a byla dosažena vyšší výpočetní rychlost algoritmu. I přesto algoritmus vykazoval několik omezení, neměl garanci konvergence a celkově byl vyhodnocen jako nevhodný. Proto byl naimplementován alternativní algoritmus Prior-incorporated Skeleton-based Stochastic Search, který zásadní problémy vyřešil a empirická interakční síť byla vygenerována. Konečně, empirická interakční síť byla použita k anotaci vybraných cirkulárních RNA pomocí algoritmu circGPA. Byly porovnány tři různé verze použití circGPA algoritmu a bylo dokázáno, že data genové exprese a experimentální podmínky mají významný vliv na anotaci cirkulárních RNA. A recent study has introduced the circGPA method for efficient GO term annotation from a given interaction network. Circular RNAs without known functions are annotated with ontological terms based on the assumption that interacting RNA molecules have similar functions and, therefore, similar annotations. However, the interaction network used in the method was constructed solely from known database interactions, which may be inactive under certain experimental setups. In this thesis, a potential solution to this problem is presented by combining empirical data specific to the experimental setup with known database interactions using the Bayesian network inference algorithm. Initially, the IntOMICS algorithm was chosen as the model. However, it was found unsuitable for the experimental data and the circRNA interaction network of the given size. Consequently, modifications of the algorithm were necessary. These modifications resulted in partial improvements in the speed of upper-bound term computation and memory requirements. Despite the improvements, the algorithm still has limitations and does not guarantee convergence. Overall, IntOMICS was found unsuitable for the task. Therefore, an alternative algorithm stemming from Prior-incorporated Skeleton-based Stochastic Search was implemented to address this problem and the empirical interaction network was successfully generated. Finally, the empirical interaction network was used for a selected subsample of circRNAs. Three different versions of the circGPA algorithm were tested, confirming the significant influence of gene expression data and experimental conditions on GO term annotation.
Collections
- Diplomové práce - 13136 [892]