Použití LZW pro kompresi a indexaci velmi podobných řetězců
Compressing and Indexing Highly Similar Strings using LZW
dc.contributor.advisor | Holub Jan | |
dc.contributor.author | Perutka Ondřej | |
dc.date.accessioned | 2016-04-07T14:36:09Z | |
dc.date.available | 2016-04-07T14:36:09Z | |
dc.date.issued | 2015-06-08 | |
dc.identifier | KOS-587864197805 | |
dc.identifier.uri | http://hdl.handle.net/10467/62976 | |
dc.description.abstract | Tato práce se zabývá vývojem nové kompresní metody založené na LZW a zarovnání řetězců. Algoritmus je pojmenován ALZW a je navržen pro kompresi velmi podobných řetězců. Daná množina řetězců je komprimována pomocí předem určeného referenčního řetězce. V porovnání s podobně zaměřeným RLZ a všeobecně použitelným GZipem umožňuje ALZW velmi rychlou kompresi a pro podobné genetické sekvence dosahuje dobrých kompresních poměrů. V případě lidského chromozomu 20 dosahuje algoritmus dokonce lepších výsledků, něž podobně zaměřený algoritmus RLZ. | cze |
dc.description.abstract | A new compression method based on LZW and sequence alignment is presented in this thesis. The algorithm is called ALZW and it is designed for compression of Highly Similar Strings. Strings in a given set are compressed relatively to a given reference sequence. Compared to similarly targeted RLZ and general purpose GZip, the algorithm offers very fast compression and it achieves good compression ratios for similar genomic sequences. It is even able to outperform the RLZ algorithm in case of human chromosome 20. | eng |
dc.language.iso | ENG | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | cze |
dc.subject | datová komprese, LZW, ALZW, velmi podobné řetězce, DNA, vyhledávání v komprimovaném textu | cze |
dc.subject | data compression, LZW, ALZW, highly similar strings, DNA, searching in compressed texts | eng |
dc.title | Použití LZW pro kompresi a indexaci velmi podobných řetězců | cze |
dc.title | Compressing and Indexing Highly Similar Strings using LZW | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.date.accepted | 2015-06-11 | |
dc.contributor.referee | Procházka Petr | |
theses.degree.discipline | Systémové programování | cze |
theses.degree.grantor | katedra teoretické informatiky | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 18101 [208]