Comparative analysis of binary classification algorithms
Comparative analysis of binary classification algorithms
dc.contributor.advisor | Bureš Miroslav | |
dc.contributor.author | Zulfiia Galimzianova | |
dc.date.accessioned | 2019-06-19T22:53:40Z | |
dc.date.available | 2019-06-19T22:53:40Z | |
dc.date.issued | 2019-06-19 | |
dc.identifier | KOS-990667524805 | |
dc.identifier.uri | http://hdl.handle.net/10467/83451 | |
dc.description.abstract | GALIMZIANOVA, Zulfiia: Srovnávací analýza binárních algoritmů klasifikace. [Diplomová práce] - České vysoké učení technické v Praze. Fakulta elektrotechnická, Katedra informatiky. Vedoucí práce: Ing. Miroslav Bureš, Ph.D. V této práci je navržena nová modifikace algoritmu SVM, který využívá nový termín regularizace. Navrhujeme formulovat omezení klasifikačního modelu jednotným způsobem a efektivně ukázat algoritmus pro nalezení řešení nového optimalizačního problému. Výkon byl porovnán se základním algoritmem SVM na veřejné datové sadě. Experimenty byly prováděny podle schématu cross-validace Monte-Carlo a výkonnostní metriky byly zvoleny jako přesnost, vyvolání, přesnost a skóre f1. Analýza výpočetního výkonu byla provedena z hlediska počtu iterací, které algoritmy potřebovaly ke konvergenci. Výsledné metrické vektory byly porovnány s použitím Wilcoxonova podepsaného hodnostního testu pro zjištění statistické významnosti nálezů. Naše výsledky z veřejného datového souboru ukázaly statisticky významné zlepšení jak z hlediska přesnosti, tak z hlediska výpočtového výkonu oproti základnímu algoritmu SVM. Metoda má proto potenciál být implementována v reálných aplikacích efektivním a nákladově efektivním způsobem. | cze |
dc.description.abstract | GALIMZIANOVA, Zulfiia: Comparative analysis of binary classification algorithms. [Master Thesis] - Czech Technical University in Prague. Faculty of Electrical Engineering, Department of Computer Science. Supervisor: Ing. Miroslav Bureš, Ph.D. In this work a new modification of the SVM algorithm that employs a new regularization term is proposed. We propose to formulate the constraints of the classification model in a uniform manner and demonstrate an algorithm to find the solution of the new optimization problem in an efficient manner. The performance was compared to the baseline SVM algorithm on a public dataset. The experiments were conducted following the Monte-Carlo cross-validation scheme and the performance metrics were chosen as accuracy, recall, precision, and f1-score. The computational performance analysis was done in terms of the number of iterations that was required by the algorithms to converge. The resulting metrics vectors were compared using Wilcoxon's signed rank test to identify the statistical significance of the findings. Our results on a public dataset demonstrated statistically significant improvements both in terms of accuracy and computational performance over the baseline SVM algorithm. As such, the method has the potential to be implemented in real-world applications in an effective and cost-efficient manner. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | binární klasifikace | cze |
dc.subject | strojové učení | cze |
dc.subject | podpora vektorového stroje | cze |
dc.subject | SVM | cze |
dc.subject | srovnávací analýza | cze |
dc.subject | problém optimalizace | cze |
dc.subject | binary classification | eng |
dc.subject | machine learning | eng |
dc.subject | SVM | eng |
dc.subject | comparative analysis | eng |
dc.subject | opimization problem | eng |
dc.subject | support vector machine | eng |
dc.title | Comparative analysis of binary classification algorithms | cze |
dc.title | Comparative analysis of binary classification algorithms | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Pinyagina Olga | |
theses.degree.discipline | Softwarové inženýrství | cze |
theses.degree.grantor | katedra počítačů | cze |
theses.degree.programme | Open Informatics | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 13136 [833]