Efektivní výpočet podobnosti sekundárních struktur RNA
Efficient similarity calculation for RNA secondary structures
Type of document
diplomová prácemaster thesis
Author
Marek Hrvol
Supervisor
Kléma Jiří
Opponent
Pospíšek Martin
Field of study
BioinformatikaStudy program
Otevřená informatikaInstitutions assigning rank
katedra počítačůRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Tato práce se zaobírá porovnáváním sekundárních struktur RNA pomocí mělkých neuronových sítí. Název nově vytvořené metody je Struc2Vec. Způsob výpočtu je založen na přepisu sekundárních struktur na slova, která jsou následně přepsána na vektory pomocí technologie Doc2vec. Pro fungování metody je nutné natrénovat model na strukturách, který lze poté využít k porovnávání s jinými strukturami. Trénování i predikce mají lineární časovou náročnost. Metoda dosáhla skoro 74% úspěšnosti při predikci mezi deseti typy struktur a skoro 96% úspěšnosti při porovnávání mezi dvěma typy sekundárních RNA struktur (eukaryoty a bakterie). Úspěšnost použitím klasických metod na stejných data-setech je 85 %, respektive 98 %. Metoda Struc2Vec nabízí alternativní možnost k porovnávání sekundárních struktur, která je vhodná v případě, že je potřeba zkrátit čas výpočtu porovnávání sekundárních struktur RNA. This work focuses on comparison of secondary RNA structures using shallow neural networks. Name of newly developed method is Struc2Vec. Struc2Vec method is based on transforming secondary RNA structures into words, which are further transformed into vectors. The method can work only after training a model with secondary structures. The model is further used for comparing different secondary structures with already trained ones. Both model training and structure prediction work in linear time complexity. The method had nearly 74 % success rate on dataset with 10 different types of secondary structures and nearly 96 % on dataset of two types of structures. Compared to the standard methods, which had 85 %, respectively 98 % success rate. Struc2Vec method offers very good trade-off between speed and accuracy. Method is suitable for cases where computation time needs to be shortened significantly.
Collections
- Diplomové práce - 13136 [892]