Metody porovnání klastrování založené na využití modelu směsi distribucí pro překrývající se komponenty
Methods of comparison of mixture-based clusterings with overlapping components
Typ dokumentu
diplomová prácemaster thesis
Autor
Dominika Vlčková
Vedoucí práce
Suzdaleva Evženie
Oponent práce
Nagy Ivan
Studijní obor
Aplikované matematicko-stochastické metodyStudijní program
Aplikace přírodních vědInstituce přidělující hodnost
katedra matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Klastrování slouží k setřídění dat s podobnými vlastnostmi do skupin, které nazýváme klastry. V případě použití různých klastrovacích algoritmů vzniká úloha porovnání výsledků shlukování. V této práci (i) porovnáváme klastrování založené na využití modelu směsi distribucí s normálními komponentami, rovnoměrnými komponentami a exponenciálními komponentami, (ii) je představen přehled metod pro porovnání výsledků klastrovacích algoritmů, (iii) je navrženo několik metod pro porovnání klastrování, které využívají váhy komponent modelu, (iv) vybrané metody včetně těch nově navržených jsou naprogramovány v prostředí Scilab a (v) experimentálně testovány na simulovaných datech, datech ze softwaru Orange a reálných datech. Cluster analysis serves to sort data with similar properties into groups that we call clusters. When using different clustering algorithms, the task of comparing the clustering results arises. In this work (i) the comparison of mixture-based clustering with normal components, uniform components and exponential components is performed,(ii)anoverviewofmethodsofcomparingclusteringalgorithmsis presented, (iii) several methods are proposed for comparing clustering that use the component weights, (iv) selected methods including those newly designed are programmed in Scilab and (v) experimentally tested using simulated data, Orange data and real data.
Kolekce
- Diplomové práce - 14101 [152]