Methods of comparison of mixture-based clusterings with overlapping components

Metody porovnání klastrování založené na využití modelu směsi distribucí pro překrývající se komponenty

Reviewers

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Date of defense

Files

Research Projects

Organizational Units

Journal Issue

Abstract

Klastrování slouží k setřídění dat s podobnými vlastnostmi do skupin, které nazýváme klastry. V případě použití různých klastrovacích algoritmů vzniká úloha porovnání výsledků shlukování. V této práci (i) porovnáváme klastrování založené na využití modelu směsi distribucí s normálními komponentami, rovnoměrnými komponentami a exponenciálními komponentami, (ii) je představen přehled metod pro porovnání výsledků klastrovacích algoritmů, (iii) je navrženo několik metod pro porovnání klastrování, které využívají váhy komponent modelu, (iv) vybrané metody včetně těch nově navržených jsou naprogramovány v prostředí Scilab a (v) experimentálně testovány na simulovaných datech, datech ze softwaru Orange a reálných datech.

Cluster analysis serves to sort data with similar properties into groups that we call clusters. When using different clustering algorithms, the task of comparing the clustering results arises. In this work (i) the comparison of mixture-based clustering with normal components, uniform components and exponential components is performed,(ii)anoverviewofmethodsofcomparingclusteringalgorithmsis presented, (iii) several methods are proposed for comparing clustering that use the component weights, (iv) selected methods including those newly designed are programmed in Scilab and (v) experimentally tested using simulated data, Orange data and real data.

Description

Citation

Underlying research data set URL

Rights/License

A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.

Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.

Endorsement

Review

Supplemented By

Referenced By