Evaluation of Local Sensitive Hashing (LSH) Algorithm in Recommender Systems

dc.description.abstractTato práce se zabývá aproximací algoritmu k-nejbližších sousedů orientovaného na uživatele pomocí metod lokálně senzitivního hashování a aplikací těchto metod do doporučovacích systémů. Práce nejprve teoreticky popisuje doporučovací systémy, kolaborativní filtrování, algoritmy hledání k-nejbližších sousedů a metody jejich aproximace pomocí metod lokálně senzitivního hashování. Na základě analýzy dané problematiky je navrhnut a implementován framework, který umožňuje testovat různé parametrizace metod lokálně senzitivního hashování. Ve frameworku lze testovat přesnost na k-nejbližších sousedů nebo úspěšnost doporučování použitím míry recall v závislosti na catalog coverage. Popsané metody jsou pomocí frameworku otestovány na dvou odlišných databázích. Z testů jednotlivých metod a parametrizací jsou vyvozeny možnosti jejich kombinace k dosažení optimálních modelů. Při testování optimálních modelů se podařilo dosáhnout velice uspokojivých výsledků. Při čase modelu LSH okolo 3 % času referenčního řešení se podařilo dosáhnout úspěšnosti doporučování mezi 97 a 99 %. Na závěr jsou diskutovány výsledky a různé poznatky z testování jednotlivých metod.cze
dc.description.abstractThis thesis deals with the approximation of the user-based k-nearest neighbor algorithm using locality-sensitive hashing methods and the application of these methods in recommender systems. First the thesis describes the recommendation systems, the collaborative filtering, the k-nearest neighbors algorithms and the method of their approximation using locality-sensitive hashing methods. Based on the analysis, framework was designed and implemented to test various parameterizations of locality-sensitive hashing methods. The precision of nearest neighbors algorithm or the success rate of recommending (by using the recall rate depending on the catalog coverage) can be tested in the framework. Described methods are tested on two separed databases using the framework. From the tests of individual methods and parameterizations, the possibilities of their combinations are derived to achieve optimal models. During the testing of the optimal models I was able to achieve very satisfactory results. At around 3 % of the reference solution time, the reached success rate was between 97 % and 99 %. Finally, I discussed the results and different findings from the testing of the individual methods.eng
