DNA base-calling from Nanopore sequencing data

Určování DNA sekvencí z Nanopore dat

Supervisors

Reviewers

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Date of defense

Research Projects

Organizational Units

Journal Issue

Abstract

Určování DNA sekvencí z Nanopore dat se v současnosti velmi rychle vyvíjí. Od představení zařízení MinION je možné se soustředit na část zvanou určování bází. Tato práce implementuje snadno použitelný nástroj, který k tomuto účelu využívá Viterbiho a Forward-Backward algoritmy. Přesnost daného řešení je porovnatelná s již existujícími nástroji jako Nanocall a DeepNano. Data použitá k testování byla získána pomocí R9 chemie z E.coli DNA molekul.

MinION Nanopore sequencing technology is a novel approach to DNA sequencing which allows to sequence individual molecules in real time and can generate continuous sequences 100 × longer than the existing short-read technologies. One of the downsides of this emerging technology is much less accurate base-calling, the process of determining the actual DNA sequence from raw data. In this work an open-source implementation of a base-caller is presented. It is based on Hidden Markov Models (HMM) and implements Viterbi and Forward-Backward algorithms. The accuracy is evaluated on E.Coli data and compared to the existing programs.

Description

Citation

Underlying research data set URL

Rights/License

A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.

Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.

Endorsement

Review

Supplemented By

Referenced By