Metody pro přibližné vyhledávání vzorků v řídkých multidimensionálních polích pomocí metod strojového učení
Approximate Pattern Matching In Sparse Multidimensional Arrays Using Machine Learning Based Methods
Type of document
diplomová prácemaster thesis
Author
Kučerová Anna
Supervisor
Krčál Luboš
Opponent
Holub Jan
Field of study
Znalostní inženýrstvíStudy program
InformatikaInstitutions assigning rank
katedra teoretické informatikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Hlavním cílem této práce je navrhnout řešení přibližného vyhledávání vzorů, které používá některou z metod strojového učení. Toho je dosaženo využitím hashování a již existujících algoritmů. Hashování se používá k nalezení pozic potenciálních výsledků. Následné ověření bylo provedeno stejným způsobem jako u existujících řešení pro lepší porovnání. Předchozí výzkum byl zaměřen především na vyhledávání v prostorech s malým počtem dimenzí. Výstupem této práce je algoritmus, který je porovnán s již existujícími řešeními. Některé z porovnávaných algoritmů byly zatím pouze teoreticky navrženy a dosud neimplementovány. Algoritmy také používají binární formát používaný v komerčních databázích. The main goal of this work is to propose a solution of approximate pattern matching with the use of machine learning based methods. This is done with the help of Locality Sensitive Hashing and existing algorithms. Idea of LSH is used for searching of positions of potential results and their verification is executed as in existing algorithms. Previous work was focused primarily on low dimensional pattern matching. The outcome of this work is an algorithm together with time measures and comparison with already existing solutions. Some of the comparing algorithms were only theoretically designed and not implemented until now. The solution also uses binary format used in a commercial array database.
Collections
- Diplomové práce - 18101 [216]