Automatická predikce funkce bílkovin jako hierarchická multi-label klasifikace
Hierarchical Multi-Label Classification for Automated Protein Function Prediction
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Martin Miadok
Vedoucí práce
Kléma Jiří
Oponent práce
Pošík Petr
Studijní obor
Základy umělé inteligence a počítačových vědStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra kybernetikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Priradzovaniu funkcie bielkovinám môže predchádzať predpovedanie ich funkcie pomocou automatických klasifikátorov. Táto práca sa venuje hierarchickej nadstavbe algoritmu BLAST-KNN, ktorý priradzuje bielkovinám atribúty z génovej ontológie na základe sekvencie aminokyselín. Nadstavba spočíva v ohodnotení hierarchických predkov atribútov a následnej klasifikácii pomocou modifikovaného algoritmu TPR. Anotácie sú vyhodnotené na ontológiách biologických procesov a molekulárnych funkcií pomocou precíznosti a senzitivity voči reálnym anotáciam. Protein function prediction using automatic classifiers may precede the actual function assignment. This thesis describes the hierarchical extension of the BLAST-KNN algorithm, which assigns gene ontology terms to proteins based on the amino acid sequences. The extension consists of the annotation of hierarchical ancestors of the terms and subsequent classification using a modified TPR algorithm. The results of the annotation by the terms from the biological process and molecular function ontologies are compared through precision and recall with the real annotations.
Kolekce
- Bakalářské práce - 13133 [778]