Zpracování, uložení a agregace genetických variant

Veronika Bůžková

Processing, storage and aggregation of genetic variants

Typ dokumentu

bakalářská práce
bachelor thesis

Autor

Veronika Bůžková

Vedoucí práce

Krupička Radim

Oponent práce

Přistoupilová Anna

Studijní obor

Biomedicínská informatika

Studijní program

Informatika a kybernetika ve zdravotnictví

Instituce přidělující hodnost

katedra informačních a komunikačních technologií v lékařství

Obhájeno

2023-06-13

Práva

A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html

Metadata

Zobrazit celý záznam

Abstrakt

Populační databáze pomáhají při interpretaci genetických variant. V těchto databázích jsou informace o frekvenci variant v různých populacích, které pomáhají určit, zda je varianta nalezená u pacienta běžná pro jeho populaci. Cílem práce bylo vytvořit řešení umožňující v budoucnu tvorbu české populační databáze. Prvním úkolem bylo navrhnout řetězec zpracování a pro něj vybrat metody a nástroje pro následnou implementaci. Navržený řetězec zpracování implementovat a spustit na vzorku dat. Pro implementaci bylo využito krom jiných nástrojů Docker, Hail a VEP (Variant Effect Predictor). Výsledkem práce jsou navržené skripty a vytvořené prostředí v Dockeru pro jejich správné spuštění. Pomocí těchto skriptů byla úspěšně vytvořená ze vzorku dat populační databáze.

Population databases help in the interpretation of genetic variants. These databases contain information about the frequency of variants in different populations to help determine whether a variant found in a patient is common in their population. The goal of the work was to create a solution enabling the creation of a Czech population database in the future. The first task was to design the workflow and to select methods and tools for subsequent implementation. Next use the designed workflow and implement it and run it on the sample data. Among other tools, Docker, Hail and VEP (Variant Effect Predictor) were used for the implementation. The result of the work is the created scripts and the created environment in Docker for their proper execution. From using these scripts on the sample data was successfully created a population database.