Metaučení přínosu příznaků
Meta-learning for feature selection
master thesis
Eliška Vondráčková
Motl Jan
Šimeček Ivan
Předmětem této práce je návrh a implementace metaučícího modelu, který online predikuje dané metapříznaky týkající se relevance příznaku pro výpočet. Zvolené algoritmy pro klasifikační a regresní modely jsou Pasivně agresivní algoritmus, Bagging, hierarchický lineární model, k-nejbližších sousedů a neuronová síť. Použitými technologiemi jsou Jupyter Notebook (Python) a knihovny scipy, creme a H2O, dále v jazyce R knihovna lmer pro hierarchický model. Výstupem práce jsou metamodely pro predikci jednotlivých metapříznaků a jejich porovnání. This thesis aims to design and implement a meta-learning model that online predicts meta-features about the relevance of the features. Classification and regression models were created based on passive aggressive algorithm, bagging, k-nearest neighbours, hierarchical linear regression, and neural network. The technologies used for implementation of these algorithms were Jupyter Notebook (Python) and libraries scipy, creme and H2O. For the hiearchical model, R language with lmer library were used. The results of the thesis are metamodels for prediction of the meta-features and their comparison.
