Shlukovací algoritmy pro nečíselná data
Clustering algorithms for nominal data
dc.contributor.advisor | Čepek Miroslav | |
dc.contributor.author | Jakeš Jan | |
dc.date.accessioned | 2015-05-28T10:43:37Z | |
dc.date.available | 2015-05-28T10:43:37Z | |
dc.identifier | KOS-587864147405 | |
dc.identifier.uri | http://hdl.handle.net/10467/61563 | |
dc.description.abstract | Cílem této diplomové práce je implementace evaluačních metod shlukové analýzy dat pro software RapidMiner. V úvodu je čtenář seznámen s problematikou tykající se shlukové analýzy dat, včetně shlukovacích metod a metrik nepodobnosti. Blíže jsou popsány evaluační metody shlukové analýzy, konkrétně výpočty hodnot Rand indexu, Dunn indexu, siluety a určení typických hodnot ve shlucích. Dále se práce věnuje samotnému RapidMineru a implementací nových operátorů Rand Index operátor, Dunn Index operátor, Silhouette operátor a Density operátor. Všechny implementované operátory byly primárně určeny pro nominální data, avšak kvůli větší použitelnosti v RapidMineru byla funkcionalita rozšířena i pro zpracování numerických a smíšených dat. Na konci práce je popsáno praktické použití nových operátorů v RapidMineru, včetně testování operátorů na větších souborech dat a ověření správnosti operátory vypočítaných hodnot. | cze |
dc.description.abstract | The main goal of this diploma thesis is implementation of evaluation methods of cluster data analysis for RapidMiner software. In the opening, reader is introduced to the issue regarding cluster data analysis, including cluster methods and similarity measures. Evaluation methods of cluster analysis, specifically calculation of value of Rand index, Dunn index, silhouette and determination of typical values in clusters. Thesis also aims at software RapidMiner and implementation of new operators - Rand Index, Dunn Index, Silhouette and Density. All implemented operators were mainly designed to work with nominal data, but due to better applicability in RapidMiner, their functionality was expanded to process even numerical and mixed data. In the end of thesis, practical use of new operators in RapidMiner is described, including testing of operators on larger datasets and verification of values calculated by operators. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | cze |
dc.subject | Shluková analýza, RapidMiner, Rand index, Dunn index, Silueta, Typické hodnoty, Nominální data, Numerická data, Shlukovací algoritmy, Podobnostní metriky | cze |
dc.title | Shlukovací algoritmy pro nečíselná data | cze |
dc.title | Clustering algorithms for nominal data | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Buk Zdeněk | |
theses.degree.discipline | Softwarové inženýrství | cze |
theses.degree.grantor | katedra počítačové grafiky a interakce | cze |
theses.degree.programme | Otevřená informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 13139 [396]