Komprese souborů FASTQ
FASTQ file compression
Type of document
diplomová prácemaster thesis
Author
Jakub Novák
Supervisor
Polách Radomír
Opponent
Trávníček Jan
Field of study
Teoretická informatikaStudy program
Informatika 2018 (magisterská)Institutions assigning rank
katedra teoretické informatikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Tato práce se zabývá analýzou struktury FASTQ souborů, výběrem vhodného kompresniho algoritmu a jeho implementaci. Velká část práce se zabývá popisem algoritmu mixováni kontextů a jeho implementaci. Dále v práci popisuji výsledky provedených testováni, porovnávám je s existujicimi řešenimi a na jejich základě navrhuji dalši možná vylepšeni. Výsledný kompresni algoritmus dosahuje lepšiho kompresniho poměru než základni komprimovaci baliček GZip, který se v praxi pro ukládáni FASTQ souborů běžně použivá. Praktická část je provedena v programovacim jazyce Java a stala se součásti kompresni knihovny Small Compression Toolkit. This thesis concerns with the analysis of a FASTQ file structure, selection of a suitable compression algorithm and its implementation. A large part of this thesis describes a context mixing algorithm and how to implement it. Furthermore, the results of performed tests are described, compared with existing solutions and possible enhancements are proposed. Implemented compression algorithm achieves better compression ratios than standard compression tool GZip, that is currently being used for storing of FASTQ files. The practical segment of this thesis is realized in the Java programming language a became part of a compression library called Small Compression Toolkit.
Collections
- Diplomové práce - 18101 [207]