Výpočet důležitosti příznaků Black-box modelů
Feature Importance for Black-box Models
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Ard Kelmendi
Vedoucí práce
Maurerová Veronika
Oponent práce
Klouda Karel
Studijní obor
Computer Science (Bachelor, in English)Studijní program
Informatics (in English)Instituce přidělující hodnost
katedra teoretické informatikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Důležitost proměnných je technika, která přiřazuje skóre vstupním proměnným (sloupcům strukturovaných dat) na základě jejich vlivu na predikování cílové proměnné. Sloupce datasetu, které jsou použity jako vstup do algoritmu strojového učení se nazývají proměnné. Některé vtupní proměnné můžou být více důležité než ostatní tím, že více ovlivňují cílovou proměnou. Globální senzitivní analýza přiřazuje hodnoty jednotlivým vstupním proměnným na základě jejich interakcích pri predikci s ohledem na cílovou proměnnou a poskytuje tak skóre pro interpretaci modelů. Cílem této bakalářské práce je popsat metodu Permutační důležitosti proměnných a implementovat tuto metodu do H2O-3 open-source Machine Learning platformy. Feature importance is a technique that assigns a score to input features (tabular data columns) based on the influence of predicting the target feature. The columns of a dataset that servers as an input of the Machine Learning algorithms are called features. Some features may be more important than others giving more influence towards the output. Global Sensitivity Analysis quantifies the importance of model features and their interactions with respect to model output. Assigning different values to the features one at a time provides the user with a mapping score of importance to features to interpret the model. The aim of this bachelor's thesis is to describe Permutation Feature Importance and implement this method to the H2O-3 open-source Machine Learning platform.
Kolekce
- Bakalářské práce - 18101 [337]