Algoritmy pro lepší porozumění doporučovaného obsahu a segmentů uživatelů
Algorithms for better understanding of recommended content and user clusters
Typ dokumentu
diplomová prácemaster thesis
Autor
Pavel Hlubík
Vedoucí práce
Kordík Pavel
Oponent práce
Vašata Daniel
Studijní obor
Znalostní inženýrstvíStudijní program
Informatika 2010Instituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Studium vztahu mezi publikem a obsahem, který konzumuje, je pro tvůrce obsahu zásadní. V této práci navrhujeme a experimentálně vyhodnocujeme různé metody vizualizace aspektů publika. Zavádíme novou techniku vkládání uživatelů a položek do stejného latentního vektorového prostoru, která dosahuje slibných výsledků na známé datové sadě Movielens. K vizualizaci publika dále využíváme samoorganizační mapy, jejichž použití pro tento typ úlohy je podle našich nejlepších znalostí novým přístupem. Poslední metodou tohoto druhu je nově publikovaný framework MDE, který překonává mnohé nevýhody t-SNE, a přitom neohrožuje kvalitu, což ukážeme experimentálně. Zabýváme se také dalšími pohledy na interakce uživatelů. Uživatelé a položky jsou propojeni pomocí Sankeyho diagramů, které nabízejí komplexní pohled na to, které skupiny uživatelů interagují s jakým obsahem, a jsou informativnější než prosté zařazení uživatelů do jedné kategorie. Navrhujeme také přístup k vizualizaci interakcí uživatelů v čase, který může pomoci analyzovat časové závislosti. Studying the relationship between audience and content they consume is vital for content creators. In this thesis, we propose and experimentally evaluate various methods to visualize aspects of the audience. We introduce a new technique of embedding users and items into the same latent vector space, which achieves promising results on the well-known Movielens dataset. To visualize the audience we further utilize self-organizing maps, usage of which for this type of task is according to our best knowledge a novel approach. The last method of this kind is a newly published framework MDE, which overcomes many drawbacks of t-SNE, yet it does not compromise quality, which we show experimentally. We also address other views of user interactions. Users and items are connected with the help of Sankey diagrams which offer a complex insight into which groups of users interact with what content and are more informative than simply classifying users into a single category. We also propose an approach to visualize user's interactions over time which may help to analyze time-dependent behavior.
Kolekce
- Diplomové práce - 18105 [164]