Doporučovací modely založené na rekurentních neuronových sítích
Recommendations Model Based on Recurrent Neural Networks
Typ dokumentu
diplomová prácemaster thesis
Autor
Ladislav Martínek
Vedoucí práce
Řehořek Tomáš
Oponent práce
Smítková Janků Ladislava
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato diplomová práce řeší problematiku doporučovacích systémů. Cílem je predikce následujících položek na základě sekvenčních dat z chování uživatelů pomocí rekurentních neuronových sítí (LSTM, GRU). Reprezentace položek je tvořena pomocí maticové faktorizace upravené pro datasety s implicitní zpětnou vazbou. V práci je navržen a implementován algoritmus pro tvorbu rekurentních modelů využívající vytvořenou reprezentaci položek. Navržen je také způsob vyhodnocování respektující sekvenční povahu dat. Metoda vyhodnocování využívá metriky recall a catalog coverage. Experimenty jsou prováděny systematicky s cílem zjistit závislosti na sledovaných metodách a hyperparametrech. Měření je prováděno na třech datových sadách. Na největším datasetu se podařilo dosáhnout více jak dvojnásobného recallu proti dalším metodám, které byly zastoupeny kolaborativním filtrováním, reminder modelem a popularity modelem. Na závěr práce jsou diskutovány zjištěné poznatky, možné zlepšení hyperparametrizací a další možné směry vylepšení modelů. This diploma thesis deals with matters of recommendation systems. The aim is to use recurrent neural networks (LSTM, GRU) to predict the subsequent interactions using sequential data from user behavior. Matrix factorization adapted for datasets with implicit feedback is used to create a representation of items (embeddings). An algorithm for creating recurrent models using the embeddings is designed and implemented in this thesis. Furthermore, an evaluation method respecting the sequential nature of the data is proposed. This evaluation method uses recall and catalog coverage metrics. Experiments are performed systematically to determine the dependencies on the observed methods and hyperparameters. The measurements were performed on three datasets. On the most extensive dataset, I managed to achieve more than double recall against other recommendation techniques, which were represented by collaborative filtering, reminder model, and popularity model. The findings, possible improvement by hyper-parametrization, and different possible means of model improvement are discussed at the end of the work.
Kolekce
- Diplomové práce - 18105 [164]