Zobrazit minimální záznam

Efficient similarity calculation for RNA secondary structures



dc.contributor.advisorKléma Jiří
dc.contributor.authorMarek Hrvol
dc.date.accessioned2019-06-13T22:53:04Z
dc.date.available2019-06-13T22:53:04Z
dc.date.issued2019-06-13
dc.identifierKOS-860412706305
dc.identifier.urihttp://hdl.handle.net/10467/83074
dc.description.abstractTato práce se zaobírá porovnáváním sekundárních struktur RNA pomocí mělkých neuronových sítí. Název nově vytvořené metody je Struc2Vec. Způsob výpočtu je založen na přepisu sekundárních struktur na slova, která jsou následně přepsána na vektory pomocí technologie Doc2vec. Pro fungování metody je nutné natrénovat model na strukturách, který lze poté využít k porovnávání s jinými strukturami. Trénování i predikce mají lineární časovou náročnost. Metoda dosáhla skoro 74% úspěšnosti při predikci mezi deseti typy struktur a skoro 96% úspěšnosti při porovnávání mezi dvěma typy sekundárních RNA struktur (eukaryoty a bakterie). Úspěšnost použitím klasických metod na stejných data-setech je 85 %, respektive 98 %. Metoda Struc2Vec nabízí alternativní možnost k porovnávání sekundárních struktur, která je vhodná v případě, že je potřeba zkrátit čas výpočtu porovnávání sekundárních struktur RNA.cze
dc.description.abstractThis work focuses on comparison of secondary RNA structures using shallow neural networks. Name of newly developed method is Struc2Vec. Struc2Vec method is based on transforming secondary RNA structures into words, which are further transformed into vectors. The method can work only after training a model with secondary structures. The model is further used for comparing different secondary structures with already trained ones. Both model training and structure prediction work in linear time complexity. The method had nearly 74 % success rate on dataset with 10 different types of secondary structures and nearly 96 % on dataset of two types of structures. Compared to the standard methods, which had 85 %, respectively 98 % success rate. Struc2Vec method offers very good trade-off between speed and accuracy. Method is suitable for cases where computation time needs to be shortened significantly.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectStruc2Veccze
dc.subjectneuronové sítěcze
dc.subjectDoc2veccze
dc.subjectpredikcecze
dc.subjectsekundární strukturacze
dc.subjectRNAcze
dc.subjectvnoření slovcze
dc.subjectumělá inteligencecze
dc.subjectstrojové učenícze
dc.subjectStruc2Veceng
dc.subjectneural networkeng
dc.subjectDoc2veceng
dc.subjectpredictioneng
dc.subjectsecondary structureeng
dc.subjectRNAeng
dc.subjectword embeddingeng
dc.subjectartificial inteligenceeng
dc.subjectmachine learningeng
dc.titleEfektivní výpočet podobnosti sekundárních struktur RNAcze
dc.titleEfficient similarity calculation for RNA secondary structureseng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereePospíšek Martin
theses.degree.disciplineBioinformatikacze
theses.degree.grantorkatedra počítačůcze
theses.degree.programmeOtevřená informatikacze


Soubory tohoto záznamu





Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam