Využití strojového učení pro detekování, kdy jsou dva produkty stejné
Using Machine Learning to Detect if Two Products Are the Same
Typ dokumentu
diplomová prácemaster thesis
Autor
Peter Jung
Vedoucí práce
Kuželka Ondřej
Oponent práce
Verbruggen Gust
Studijní obor
Umělá inteligenceStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
V tejto práci sa zamieravame na možnosti využitia strojového učenia v oblasti e-commerce. S konkrétnym využitím pre párovanie produktov a ich ponúk od roznych obchodov. Aj ked všetky metódy budú optimalizované pre toto použitie, ich techniky sa mozu neskor využiť aj na iné oblasti, ako napríklad obohacovanie katalógu produktov o nové parametre pre produkty alebo pokročilé formy vyhľadávania. V závere využijeme naprogramované REST API, ktoré využíva náš model, na evaluáciu nad reálnymi problémami, ktoré postihujú dnešné online katalógy produktov. A to zamezenie duplicitám a zle napárovaných ponúk od obchodov k produktom. In this work, we investigate ways to use machine learning in the e-commerce field, with an application for the problem of pairing different descriptions of the same product from various online shops. Even though we evaluate the methods developed in this thesis only on this problem, they could be used in various areas. In addition, we create a new REST API and use it to evaluate our model on real-world datasets. Specifically, we apply our methods for finding duplicates in an existing online catalog aggregating items from hundreds of e-shops.
Kolekce
- Diplomové práce - 13136 [902]