Určování DNA sekvencí z Nanopore dat
DNA base-calling from Nanopore sequencing data
Typ dokumentu
diplomová prácemaster thesis
Autor
Horák Tomáš
Vedoucí práce
Daněček Petr
Oponent práce
Holub Jan
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra teoretické informatikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Určování DNA sekvencí z Nanopore dat se v současnosti velmi rychle vyvíjí. Od představení zařízení MinION je možné se soustředit na část zvanou určování bází. Tato práce implementuje snadno použitelný nástroj, který k tomuto účelu využívá Viterbiho a Forward-Backward algoritmy. Přesnost daného řešení je porovnatelná s již existujícími nástroji jako Nanocall a DeepNano. Data použitá k testování byla získána pomocí R9 chemie z E.coli DNA molekul. MinION Nanopore sequencing technology is a novel approach to DNA sequencing which allows to sequence individual molecules in real time and can generate continuous sequences 100 × longer than the existing short-read technologies. One of the downsides of this emerging technology is much less accurate base-calling, the process of determining the actual DNA sequence from raw data. In this work an open-source implementation of a base-caller is presented. It is based on Hidden Markov Models (HMM) and implements Viterbi and Forward-Backward algorithms. The accuracy is evaluated on E.Coli data and compared to the existing programs.
Kolekce
- Diplomové práce - 18101 [216]