Metody pro přibližné vyhledávání vzorků v řídkých multidimensionálních polích pomocí metod strojového učení
Approximate Pattern Matching In Sparse Multidimensional Arrays Using Machine Learning Based Methods
Typ dokumentu
diplomová prácemaster thesis
Autor
Kučerová Anna
Vedoucí práce
Krčál Luboš
Oponent práce
Holub Jan
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra teoretické informatikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Hlavním cílem této práce je navrhnout řešení přibližného vyhledávání vzorů, které používá některou z metod strojového učení. Toho je dosaženo využitím hashování a již existujících algoritmů. Hashování se používá k nalezení pozic potenciálních výsledků. Následné ověření bylo provedeno stejným způsobem jako u existujících řešení pro lepší porovnání. Předchozí výzkum byl zaměřen především na vyhledávání v prostorech s malým počtem dimenzí. Výstupem této práce je algoritmus, který je porovnán s již existujícími řešeními. Některé z porovnávaných algoritmů byly zatím pouze teoreticky navrženy a dosud neimplementovány. Algoritmy také používají binární formát používaný v komerčních databázích. The main goal of this work is to propose a solution of approximate pattern matching with the use of machine learning based methods. This is done with the help of Locality Sensitive Hashing and existing algorithms. Idea of LSH is used for searching of positions of potential results and their verification is executed as in existing algorithms. Previous work was focused primarily on low dimensional pattern matching. The outcome of this work is an algorithm together with time measures and comparison with already existing solutions. Some of the comparing algorithms were only theoretically designed and not implemented until now. The solution also uses binary format used in a commercial array database.
Kolekce
- Diplomové práce - 18101 [216]