User Behavior Clustering and Behavior Modeling Based on Clickstream Data
Shlukování a modelování chování uživatelů založené na datech z webového prohlížeče
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
Abstract
S rostoucím počtem uživatelů internetu je dobrá znalost chování jeho uživatelů nezbytná. V této práci zkoumáme různé způsoby, jak reprezentovat chování uživatelů internetu a možnosti, jak tuto znalost poté použít pro shlukování a pro částečně řízené učení. Navrhujeme dva různé způsoby transformace snímaných clickstreamů společně s dalšími událostmi z prohlížeče do vektorového prostoru. První metoda je založena na frekvencích událostí a druhá je založena na distribuovaném bag-of-words. Druhá představená metoda vykazuje slibné výsledky při úkolech shlukování a částečně řízeného učení.
With growing online population having a good understanding of users' behavior on the internet is becoming very important. In this thesis, we explore different ways how to represent the behavior of online users and how to apply clustering and semi-supervised learning methods to this knowledge. We propose two different approaches how to transform captured clickstreams together with other events to the vector space. The first method is based on frequencies of the events and the second one is build on top of distributed bag-of-words. The second method shows promising results in clustering and semi-supervised tasks.
With growing online population having a good understanding of users' behavior on the internet is becoming very important. In this thesis, we explore different ways how to represent the behavior of online users and how to apply clustering and semi-supervised learning methods to this knowledge. We propose two different approaches how to transform captured clickstreams together with other events to the vector space. The first method is based on frequencies of the events and the second one is build on top of distributed bag-of-words. The second method shows promising results in clustering and semi-supervised tasks.
Description
Citation
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.