Standardní rozhodovací stromy ve strojovém učení
Standard Decision Trees in Machine Learning
Typ dokumentu
diplomová prácemaster thesis
Autor
Yuliia Syzon
Vedoucí práce
Valenta Adam
Oponent práce
Klouda Karel
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyObhájeno
2023-02-15Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce analyzuje přístupy vytváření rozhodovacího stromu a význam rozhodovacího stromu jakožto algoritmu pro vysvětlitelnost modelů strojového učení. Je představeno několik tradičních i nových přístupů z hlediska použitelnosti pro velké objemy dat a distribuované systémy. Praktická část této práce spočívá v návrhu a implementaci standardního rozhodovacího stromu pro open-source platformu H2O-3, optimalizovaného pro distribuované výpočty. Je implementován standardní hladový přístup. Hodnocení implementovaného řešení obsahuje srovnání škálovatelnosti v porovnání s jinými implementacemi na vybraných testovacích datových sadách. This thesis analyzes approaches for Decision Tree creation and the importance of the Decision Tree algorithm for Machine Learning Explainability. Several traditional and novel approaches are explained and analyzed in terms of usability for Big Data and distributed systems. The practical part of this work consists of designing and implementing the Standard Decision Tree for the H2O-3 Machine Learning Platform applicable to Big Data and optimized for distributed computations. The standard greedy approach is implemented. The evaluation of the implemented solution contains scalability and performance comparisons with other solutions on selected benchmark datasets.
Kolekce
- Diplomové práce - 18105 [164]