Evaluace algoritmů lokálně senzitivního hashování (LSH) v doporučovacích systémech
Evaluation of Local Sensitive Hashing (LSH) Algorithm in Recommender Systems
Type of document
bakalářská prácebachelor thesis
Author
Martínek Ladislav
Supervisor
Řehořek Tomáš
Opponent
Kordík Pavel
Field of study
Znalostní inženýrstvíStudy program
InformatikaInstitutions assigning rank
katedra aplikované matematikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Tato práce se zabývá aproximací algoritmu k-nejbližších sousedů orientovaného na uživatele pomocí metod lokálně senzitivního hashování a aplikací těchto metod do doporučovacích systémů. Práce nejprve teoreticky popisuje doporučovací systémy, kolaborativní filtrování, algoritmy hledání k-nejbližších sousedů a metody jejich aproximace pomocí metod lokálně senzitivního hashování. Na základě analýzy dané problematiky je navrhnut a implementován framework, který umožňuje testovat různé parametrizace metod lokálně senzitivního hashování. Ve frameworku lze testovat přesnost na k-nejbližších sousedů nebo úspěšnost doporučování použitím míry recall v závislosti na catalog coverage. Popsané metody jsou pomocí frameworku otestovány na dvou odlišných databázích. Z testů jednotlivých metod a parametrizací jsou vyvozeny možnosti jejich kombinace k dosažení optimálních modelů. Při testování optimálních modelů se podařilo dosáhnout velice uspokojivých výsledků. Při čase modelu LSH okolo 3 % času referenčního řešení se podařilo dosáhnout úspěšnosti doporučování mezi 97 a 99 %. Na závěr jsou diskutovány výsledky a různé poznatky z testování jednotlivých metod. This thesis deals with the approximation of the user-based k-nearest neighbor algorithm using locality-sensitive hashing methods and the application of these methods in recommender systems. First the thesis describes the recommendation systems, the collaborative filtering, the k-nearest neighbors algorithms and the method of their approximation using locality-sensitive hashing methods. Based on the analysis, framework was designed and implemented to test various parameterizations of locality-sensitive hashing methods. The precision of nearest neighbors algorithm or the success rate of recommending (by using the recall rate depending on the catalog coverage) can be tested in the framework. Described methods are tested on two separed databases using the framework. From the tests of individual methods and parameterizations, the possibilities of their combinations are derived to achieve optimal models. During the testing of the optimal models I was able to achieve very satisfactory results. At around 3 % of the reference solution time, the reached success rate was between 97 % and 99 %. Finally, I discussed the results and different findings from the testing of the individual methods.
Collections
- Bakalářské práce - 18105 [295]