Určování DNA sekvencí z Nanopore dat
DNA base-calling from Nanopore sequencing data
Type of document
diplomová prácemaster thesis
Author
Horák Tomáš
Supervisor
Daněček Petr
Opponent
Holub Jan
Field of study
Znalostní inženýrstvíStudy program
InformatikaInstitutions assigning rank
katedra teoretické informatikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Určování DNA sekvencí z Nanopore dat se v současnosti velmi rychle vyvíjí. Od představení zařízení MinION je možné se soustředit na část zvanou určování bází. Tato práce implementuje snadno použitelný nástroj, který k tomuto účelu využívá Viterbiho a Forward-Backward algoritmy. Přesnost daného řešení je porovnatelná s již existujícími nástroji jako Nanocall a DeepNano. Data použitá k testování byla získána pomocí R9 chemie z E.coli DNA molekul. MinION Nanopore sequencing technology is a novel approach to DNA sequencing which allows to sequence individual molecules in real time and can generate continuous sequences 100 × longer than the existing short-read technologies. One of the downsides of this emerging technology is much less accurate base-calling, the process of determining the actual DNA sequence from raw data. In this work an open-source implementation of a base-caller is presented. It is based on Hidden Markov Models (HMM) and implements Viterbi and Forward-Backward algorithms. The accuracy is evaluated on E.Coli data and compared to the existing programs.
Collections
- Diplomové práce - 18101 [216]