Aproximační algoritmy pro shlukování
Approximation Algorithms for Clustering
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Ananyev Vladimir
Vedoucí práce
Borovička Tomáš
Oponent práce
Šabata Tomáš
Studijní obor
Computer Science (Bachelor, in English)Studijní program
Informatics (in English)Instituce přidělující hodnost
katedra teoretické informatikyObhájeno
2019-02-14Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Aglomerativni hierarchické shlukováni je důležitý shlukovaci algoritmus, který má mnoho praktických využiti, na přiklad pro segmentaci trhu. Jeho největši nevýhodou je jeho velká časová složitost O(n^3). Cilem této práce je popsat a zanalyzovat algoritmy aproximujici aglomerativni hierarchické shlukováni. Tyto algoritmy maji nižši časovou složitost a produkuji srovnatelné výsledky s exaktnimi metodami. Experimenty ukázaly, že aproximačni algoritmus LSH-link je signifikantně rychlejši na velkých datech než exaktni algoritmus MST-linkage algoritmus. Agglomerative hierarchical clustering is an important clustering algorithm which has many real life applications such as customer segmentation. Its biggest drawback is its large time complexity of O(n 3 ). This thesis presents and describes approximation algorithms to the agglomerative hierarchical clustering. Such algorithms have lower time complexity and produce similar results to the agglomerative hierarchical clustering. The experiments showed that for the large data sets the approximation method LSH-link performed significantly faster then the MST-linkage, an agglomerative hierarchical clustering algorithm for the single linkage.
Kolekce
- Bakalářské práce - 18101 [349]