ČVUT DSpace
  • Search DSpace
  • Čeština
  • Login
  • Čeština
  • Čeština
View Item 
  •   ČVUT DSpace
  • České vysoké učení technické v Praze
  • Fakulta informačních technologií
  • katedra teoretické informatiky
  • Bakalářské práce - 18101
  • View Item
  • České vysoké učení technické v Praze
  • Fakulta informačních technologií
  • katedra teoretické informatiky
  • Bakalářské práce - 18101
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Zlepšování algoritmů pro učení se řadit

Improving Learning to Rank Algorithms

Type of document
bakalářská práce
bachelor thesis
Author
Vu Huy Hoang
Supervisor
Kordík Pavel
Opponent
Maldonado Lopez Juan Pablo
Field of study
Teoretická informatika
Study program
Informatika
Institutions assigning rank
katedra teoretické informatiky
Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item record
Abstract
V této práci se zabývám existujícími algoritmy pro úlohu přeřazení URL podle relevance na základě uživatelského dotazu do vyhledávače a metodami kolaborativního filtrování, které uvádím v rešerši. Vybrané algoritmy, což jsou ES-Rank a maticová faktorizace, pak implementuji a použiji na dataset poskytnutý společností Yandex v rámci soutěže Personalized Web Search Challenge na Kaggle.com. Poté porovnávám přesnost řazení s ostatními řešeními na Kaggle.com. Následně testuji, jestli kolaborativní filtrování metodou maticové faktorizace významně zvyšuje přesnost řazení. Nakonec analyzuji časovou složitost svého řešení.
 
In this thesis I explore existing approaches to the learning to rank problem and collaborative filtering methods, and apply them to Yandex's dataset provided in the Personalized Web Search Challenge competition on Kaggle.com. I build on the existing submissions by replicating the top competitor's feature extraction from the dataset. Then I implement and apply ES-Rank and matrix factorization on these features and test if matrix factorization based collaborative filtering significantly increases the overall performance of the algorithm. Then I compare the performance of the implemented algorithms to other submissions on Kaggle. Lastly I analyze the time complexity of my solution.
 
URI
http://hdl.handle.net/10467/76809
View/Open
PLNY_TEXT (334.0Kb)
POSUDEK (137.2Kb)
POSUDEK (135.9Kb)
Collections
  • Bakalářské práce - 18101 [285]

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Useful links

CTU in PragueCentral library of CTUAbout CTU Digital LibraryResourcesStudy and library skillsResearch support

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV