Vyhledávání řetězcových vzorků s použitím záměn
String Pattern Matching with Swaps
Type of document
bakalářská prácebachelor thesis
Author
Blažej Václav
Supervisor
Valla Tomáš
Opponent
Suchý Ondřej
Field of study
Teoretická informatikaStudy program
InformatikaInstitutions assigning rank
katedra teoretické informatikyDefended
2015-06-17Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Show full item recordAbstract
Vyhledávání řetězcových vzorků s použitím záměn je problém hledání všech výskytů vzorků v textu, přičemž je ve vzorku dovoleno zaměňovat sousední symboly.
Cílem je navrhnout rychlý vyhledávací algoritmus, který využije bitového paralelismu bitových instrukcí koncového stroje.
Nedávno jsme nalezli závažnou chybu v algoritmu od [Ahmed et al.: The swap matching problem revisited, Theor. Comp. Sci. 2014], kterou detailně popíšeme.
Zároveň ukážeme proč tento algoritmus nelze jednoduše opravit. Pattern matching with swaps problem is to find all occurrences of pattern in text while allowing pattern to swap adjacent symbols.
The goal is to design fast matching algorithm that takes advantage of the bit parallelism of bitwise machine instructions.
We recently found a fatal flaw in the algorithm by [Ahmed et al.: The swap matching problem revisited, Theor. Comp. Sci. 2014] which we describe in detail.
Moreover we show why this algorithm cannot be fixed in any simple way.
Furthermore we devise a new algorithm which is based on different principles and we prove its correctness.
Finally we generalize this algorithm to solve the wildcard pattern matching with swaps problem.
Collections
- Bakalářské práce - 18101 [348]