Detekce selekčních tlaků na lidské endogenní retroviry
Detection of Selection Pressure on Human Endogenous Retroviruses
Type of document
bakalářská prácebachelor thesis
Author
Tuan Anh Ho
Supervisor
Pačes Jan
Opponent
Le Anh Vu
Field of study
Informatika a počítačové vědyStudy program
Otevřená informatikaInstitutions assigning rank
katedra kybernetikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Lidský genom se skládá z kódující a nekódující DNA. Kódující DNA obsahuje asi dvě procenta genomu. Kóduje proteiny, molekuly funkční RNA a regulační prvky. Podstatná část nekódující DNA se také v různé míře přepisuje na molekuly RNA neznámé nebo pouze částečně známé funkce. Velká část nekódující DNA sestává z repetitivních nukleotidových sekvencí. Asi osm procent lidského genomu je tvořeno endogenními retroelementy, což jsou zbytky retrovirů, které infikovaly lidi ve dávné minulosti. Počet těchto lokusů vyvolává otázku o jejich možném vlivu na fitness hostitele. V této práci řešíme tuto otázku odhadem selekčního tlaku na tyto sekvence. Použili jsme data z projektu " 1000 human genome project" a aplikovali metody založené na frekvenčním spektru mutací. Výsledky jsou pro vědeckou komunitu veřejně přístupné v online databázi HERVd, která je součástí ELIXIR, evropská infrastruktura pro biologické vědy. The human genome consists of coding and non-coding DNA. The coding DNA comprises about two percent of the genome. It encodes proteins, molecules of functional RNA and regulatory elements. A substantial part of the non-coding DNA is also transcribed to a various extent to RNA molecules of unknown or only partially known function. Large portions of the non-coding DNA consists of repetitive nucleotide sequences. About eight percent of the human genome are endogenous retroelements that are remnants of retroviruses that infected humans in ancient times. Abundance of these loci raises a question about their possible functionality influencing fitness of the host. In this work, we approached this question by estimating selection pressure on these DNA sequences. We used data from the "1000 human genomes project" and applied the methods based on site frequency spectrum. The results are publicly available for the scientific community at the HERVd online database, part of ELIXIR, the European life-sciences Infrastructure.
Collections
- Bakalářské práce - 13133 [706]