Zpracování, uložení a agregace genetických variant
Processing, storage and aggregation of genetic variants
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Veronika Bůžková
Vedoucí práce
Krupička Radim
Oponent práce
Přistoupilová Anna
Studijní obor
Biomedicínská informatikaStudijní program
Informatika a kybernetika ve zdravotnictvíInstituce přidělující hodnost
katedra informačních a komunikačních technologií v lékařstvíObhájeno
2023-06-13Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Populační databáze pomáhají při interpretaci genetických variant. V těchto databázích jsou informace o frekvenci variant v různých populacích, které pomáhají určit, zda je varianta nalezená u pacienta běžná pro jeho populaci. Cílem práce bylo vytvořit řešení umožňující v budoucnu tvorbu české populační databáze. Prvním úkolem bylo navrhnout řetězec zpracování a pro něj vybrat metody a nástroje pro následnou implementaci. Navržený řetězec zpracování implementovat a spustit na vzorku dat. Pro implementaci bylo využito krom jiných nástrojů Docker, Hail a VEP (Variant Effect Predictor). Výsledkem práce jsou navržené skripty a vytvořené prostředí v Dockeru pro jejich správné spuštění. Pomocí těchto skriptů byla úspěšně vytvořená ze vzorku dat populační databáze. Population databases help in the interpretation of genetic variants. These databases contain information about the frequency of variants in different populations to help determine whether a variant found in a patient is common in their population. The goal of the work was to create a solution enabling the creation of a Czech population database in the future. The first task was to design the workflow and to select methods and tools for subsequent implementation. Next use the designed workflow and implement it and run it on the sample data. Among other tools, Docker, Hail and VEP (Variant Effect Predictor) were used for the implementation. The result of the work is the created scripts and the created environment in Docker for their proper execution. From using these scripts on the sample data was successfully created a population database.