Vícevláknová implementace "Four Russians" algoritmu pro výpočet editační vzdálenosti
Multi-threaded implementation of "Four Russians" edit distance algorithm
dc.contributor.advisor | Šimeček Ivan | |
dc.contributor.author | Martin Rejmon | |
dc.date.accessioned | 2019-06-20T22:52:35Z | |
dc.date.available | 2019-06-20T22:52:35Z | |
dc.date.issued | 2019-06-20 | |
dc.identifier | KOS-762877380805 | |
dc.identifier.uri | http://hdl.handle.net/10467/83505 | |
dc.description.abstract | Editační vzdálenost lze vypočítat s obecně známým algoritmem využívajícím dynamické programování v čase O(n^2), kde n je délka vstupních řetězců. Algoritmus Čtyř Rusů zlepšuje tuto složitost s pomocí vyhledávací tabulky o faktor (log(n))^2. V této práci je tento algoritmus podrobně prozkoumán a důležité implementační detaily jsou prodiskutovány, přičemž zvláštní ohled je brán na paralelizování algoritmu a zmenšení velikosti vyhledávací tabulky. Implementace v jazyce C++ je poskytnuta a její výkon je porovnán v několika experimentech s populární knihovnou na výpočet editační vzdálenosti. Výsledky naznačují, že algoritmus je v praxi použitelnou volbou, ale není optimální. | cze |
dc.description.abstract | Edit distance can be computed with the well-known dynamic programming algorithm in O(n^2) time, where n is the length of the input strings. The Four-Russians algorithm improves this complexity by a factor of (log(n))^2 by using a lookup table. In this thesis, the algorithm is thoroughly examined and important implementation details are discussed, with special consideration given to parallelizing the algorithm and reducing the size of the lookup table. An implementation in C++ is provided and its performance is compared with a popular edit distance library in several experiments. The results indicate that the algorithm is a viable option in practice, but not optimal | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | editační vzdálenost | cze |
dc.subject | algoritmus Čtyř Rusů | cze |
dc.subject | implementace | cze |
dc.subject | paralelizace | cze |
dc.subject | edit distance | eng |
dc.subject | Four-Russians algorithm | eng |
dc.subject | implementation | eng |
dc.subject | parallelization | eng |
dc.title | Vícevláknová implementace "Four Russians" algoritmu pro výpočet editační vzdálenosti | cze |
dc.title | Multi-threaded implementation of "Four Russians" edit distance algorithm | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Valla Tomáš | |
theses.degree.discipline | Teoretická informatika | cze |
theses.degree.grantor | katedra teoretické informatiky | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 18101 [349]