Metody porovnání klastrování založené na využití modelu směsi distribucí pro překrývající se komponenty

Dominika Vlčková

Methods of comparison of mixture-based clusterings with overlapping components

Typ dokumentu

diplomová práce
master thesis

Autor

Dominika Vlčková

Vedoucí práce

Suzdaleva Evženie

Oponent práce

Nagy Ivan

Studijní obor

Aplikované matematicko-stochastické metody

Studijní program

Aplikace přírodních věd

Instituce přidělující hodnost

katedra matematiky

Práva

A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html

Metadata

Zobrazit celý záznam

Abstrakt

Klastrování slouží k setřídění dat s podobnými vlastnostmi do skupin, které nazýváme klastry. V případě použití různých klastrovacích algoritmů vzniká úloha porovnání výsledků shlukování. V této práci (i) porovnáváme klastrování založené na využití modelu směsi distribucí s normálními komponentami, rovnoměrnými komponentami a exponenciálními komponentami, (ii) je představen přehled metod pro porovnání výsledků klastrovacích algoritmů, (iii) je navrženo několik metod pro porovnání klastrování, které využívají váhy komponent modelu, (iv) vybrané metody včetně těch nově navržených jsou naprogramovány v prostředí Scilab a (v) experimentálně testovány na simulovaných datech, datech ze softwaru Orange a reálných datech.

Cluster analysis serves to sort data with similar properties into groups that we call clusters. When using diﬀerent clustering algorithms, the task of comparing the clustering results arises. In this work (i) the comparison of mixture-based clustering with normal components, uniform components and exponential components is performed,(ii)anoverviewofmethodsofcomparingclusteringalgorithmsis presented, (iii) several methods are proposed for comparing clustering that use the component weights, (iv) selected methods including those newly designed are programmed in Scilab and (v) experimentally tested using simulated data, Orange data and real data.

URI

http://hdl.handle.net/10467/83332

Kolekce

Diplomové práce - 14101 [152]