Hierarchical Multi-Label Classification for Automated Protein Function Prediction
Automatická predikce funkce bílkovin jako hierarchická multi-label klasifikace
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
Abstract
Priradzovaniu funkcie bielkovinám môže predchádzať predpovedanie ich funkcie pomocou automatických klasifikátorov. Táto práca sa venuje hierarchickej nadstavbe algoritmu BLAST-KNN, ktorý priradzuje bielkovinám atribúty z génovej ontológie na základe sekvencie aminokyselín. Nadstavba spočíva v ohodnotení hierarchických predkov atribútov a následnej klasifikácii pomocou modifikovaného algoritmu TPR. Anotácie sú vyhodnotené na ontológiách biologických procesov a molekulárnych funkcií pomocou precíznosti a senzitivity voči reálnym anotáciam.
Protein function prediction using automatic classifiers may precede the actual function assignment. This thesis describes the hierarchical extension of the BLAST-KNN algorithm, which assigns gene ontology terms to proteins based on the amino acid sequences. The extension consists of the annotation of hierarchical ancestors of the terms and subsequent classification using a modified TPR algorithm. The results of the annotation by the terms from the biological process and molecular function ontologies are compared through precision and recall with the real annotations.
Protein function prediction using automatic classifiers may precede the actual function assignment. This thesis describes the hierarchical extension of the BLAST-KNN algorithm, which assigns gene ontology terms to proteins based on the amino acid sequences. The extension consists of the annotation of hierarchical ancestors of the terms and subsequent classification using a modified TPR algorithm. The results of the annotation by the terms from the biological process and molecular function ontologies are compared through precision and recall with the real annotations.
Description
Keywords
Citation
Underlying research data set URL
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.