Show simple item record

Extension of genotype population-based phasing with



dc.contributor.advisorGavenčiak Tomáš
dc.contributor.authorLebedeva Anastasia
dc.date.accessioned2018-06-19T22:04:15Z
dc.date.available2018-06-19T22:04:15Z
dc.date.issued2018-06-13
dc.identifierKOS-773337369905
dc.identifier.urihttp://hdl.handle.net/10467/77079
dc.description.abstractHaplotypem rozumíme skupinu alel, které jsou přenášeny společně. Přestože většina genet-ického výzkumu vyžaduje znalost haplotypů, v současnosti dostupné technologie sekvenování DNA tuto informaci explicitně neposkytují. Z tohoto důvodu probíha aktivně vývoj výpočet-ních metod pro odhad haplotypů (neboli fázování). Některé z aktuálně používaných platforem pro sekvenování produkují fragmenty pokrý-vající dlouhé úseky původní DNA. Kdykoli fragment pokrývá více než jednu heterozygotní variantu, lze tuto informaci efektivně využít během fázování. Fázování pracující pouze s fragmenty DNA nicméně nedosahuje požadované přesnosti kvůli vysoké chybovosti těchto platforem. Na druhou stranu, metody populačního genotypového fázování, které dosahují vysoké přesnosti, jsou často výpočetně příliš náročné. V nedávné době Eagle2 (algoritmus populačního genotypoveho fázování) v rychlosti výrazně překonal dosud dostupné fázovací algoritmy bez ztráty přesnosti. V této práci představujeme nový algoritmus fázování, který kombinuje vlastnosti Eagle2 se schopnostmi fragmentového fázování. Tímto je umožněno zvýšení přesnosti bez nárůstu časové složitosti a zároveň do-voluje operovat na menším referenčním panelu.cze
dc.description.abstractThe term haplotype refers to a group of alleles in an organism that is inherited together from a single parent. Although the majority of genetic studies requires knowledge of haplotypes, available DNA sequencing technologies do not produce the information explicitly. For that reason, various computational methods for haplotype estimation (also known as phasing) have been actively developed. Some of the currently available sequencing platforms produce fragments spanning long regions of original DNA. As soon as a fragment spans more that one heterozygous variant, this information can be efficiently utilized during phasing. However, phasing based only on reads does not achieve sufficient accuracy due to the high sequencing error rate longer reads suffer from. At the same time, population-based phasing methods which are highly accurate and constitute current state-of-the-art are often computationally too expensive. Recently, Eagle2 population-based phasing algorithm significantly outperformed available phasing software in terms of run time requirements without loss in accuracy. In this work we present a new phasing algorithm which adopts main features of the Eagle2 algorithm and extends the method by read-based phasing. This allows to increase phasing accuracy without increasing time complexity. It also allows to perform phasing on a smaller reference panel.eng
dc.language.isoENG
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectOdhad haplotypů,Fázování,Fragmentové fázovánícze
dc.subjectHaplotype estimation,Phasing,Read-based phasingeng
dc.titleRozšíření populačního genotypového fázování o fragmentové fázovánícze
dc.titleExtension of genotype population-based phasing witheng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.date.accepted
dc.contributor.refereeKléma Jiří
theses.degree.disciplineBioinformatikacze
theses.degree.grantorkatedra počítačůcze
theses.degree.programmeOtevřená informatikacze


Files in this item





This item appears in the following Collection(s)

Show simple item record