Shluková analýza pro data smíšeného spojitého a diskrétního typu
Clustering mixed-type continuous and discrete data
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Vlčková Dominika
Vedoucí práce
Suzdaleva Evženie
Oponent práce
Nagy Ivan
Studijní obor
Matematické inženýrstvíStudijní program
Aplikace přírodních vědInstituce přidělující hodnost
katedra matematikyObhájeno
2017-09-06Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Shluková analýza hledá shluky dat, které jsou navzájem podobné. Shlukování smíšených dat znamená, že data jsou spojitá a diskrétní. Cílem této práce je sestavení přehledu nalezených metod shlukování dat smíšeného typu s využitím modelu směsi distribucí. Pro každou vybranou metodu je sepsán strukturní algoritmus. Vybrané metody jsou naprogramovány v softwaru Scilab. Výsledky experimentů klastrovaní reálných dat pomocí vybraných metod ukazují velmi podobné umístění a tvary klastrů. To potvrzuje správné nalezení klastrů. Použité metody zahrnují Bayesův prediktivní model pro shlukování, shlukově-vážený model pro shlukování, K-means shlukování a fuzzy c-means shlukování. Vybrané metody popsané v této práci lze použít pro další výzkum v oblasti shlukování dat smíšeného typu. The cluster analysis looks for clusters of data with similar features. Clustering mixed-type data means that data are both continuous and discrete. The aim of this thesis is to present the overview of the known methods of clustering mixed-type data using the mixture models. For each chosen method a structural algorithm has been written. The methods chosen are programmed using the software Scilab. The results of clustering the real data with the help of the chosen methods demonstrate very similar location and shapes of the clusters. This confirms the correct finding of clusters. Methods used include the Bayesian predictive model for clustering, cluster-weighted model for clustering, K-means clustering and fuzzy c-means clustering. The chosen methods described in this work can be used for the further research in the area of clustering mixed-type data.
Kolekce
- Bakalářské práce - 14101 [278]