AutoML přístup v doporučujících systémech
AutoML approach in recommendation systems
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Daniil Pastukhov
Vedoucí práce
Kuznetsov Stanislav
Oponent práce
Vančura Vojtěch
Studijní obor
Znalostní inženýrstvíStudijní program
Informatika 2009Instituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Ve všech oblastech strojového učení, stejně jako v doporučovacích systémech, není snadné rozhodnout, který model by měl být v daném kontextu použit. Doporučovací systémy jsou softwarové nástroje, které se snaží předpovědět, o jaké položky by měl uživatel zájem. Cílem této práce je vyhodnotit různé přístupy AutoML s využitím nejmodernějších algoritmů a metrik, jako recall, pokrytí katalogu a serendipity. AutoML je proces automatizace časově náročného a iterativního procesu trénování ML modelu. V AutoML existují dva vhodné přístupy, které jsme si vybrali k experimentování - hyperparametrická optimalizace a metaučení. V této práci jsme testovali nejmodernější algoritmy na veřejně dostupných datových sadách MovieLens s využitím technik AutoML. Také jsme navrhli alternativní definici serendipity. In all machine learning domains, as well as in recommendation systems, it is not easy to decide which model should be used in a given context. Recommendation systems are software tools trying to predict what items a user would be interested in. This thesis aims to evaluate different AutoML approaches using state-of-the-art algorithms and metrics, such as recall, catalogue coverage, and serendipity. AutoML is a process of automating the time-consuming and iterative training process of the ML model. There two relevant approaches in AutoML that we have chosen to experiment with --- Hyperparameter optimization and Meta-Learning. In this thesis, we tested state-of-the-art algorithms on publicly available MovieLens datasets employing AutoML techniques, and also proposed the alternative definition of serendipity.
Kolekce
- Bakalářské práce - 18105 [370]