Klasifikace obrázků produktů za použití hlubokých neuronových sítí
Deep Neural Networks for Classification of Product Images
Typ dokumentu
diplomová prácemaster thesis
Autor
Sivák Filip
Vedoucí práce
Reinštein Michal
Oponent práce
Kubínyi Michal
Studijní obor
Počítačové vidění a digitální obrazStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra kybernetikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Vysoké množství produktu a kategorií dostupných v soucasných elektronických obchodech zpusobují, že validace dat je pracná a drahá. Proto vzniká snaha automatizovat validaci správného umístnení produktu ve své kategorii. Francouzský elektronický obchod CDiscount proto vyhlásil soutež hostovanou na Kaggle, kde zverejnil dataset s více než 7 miliony produkty. Cílem je klasifikovat produkty obsahující jeden ci více obrázku do jedné z 5270 kategorií. Tato diplomová práce navrhuje, implementuje a experimentálne overuje architekturu hluboké neuronové síte pro kalsifikaci zboží elektronických obchodu s výjimkou potravin. Pro zmírnení výpocetní nárocnosti pro použití na dostupném hardwaru je navržena hierarchická architektura neuronových sítí, která využívá existující hierarchickou taxonomii kategorií. Hierarchická architektura dosáhla Top-1 skóre 0.61061. Pretrénováním neuronové síte klasifikující obaly knih bylo overeno, že specifický model, jenž je soucástí hierarchické architektury, muže být úspešne pretrénován pro podobnou trénovací množinu. Model predtrénovaný na knihách dosáhl lepšího výsledku, než totožný model naucený na ImageNet datasetu. The high numbers of products and categories on today E-commerce sites render validation of the data as labor intensive and expensive task. Therefore, there is a recent push to automate validation of correct placement of product in category. The French E-commerce company CDiscount has launched Kaggle competition, sharing huge dataset of over 7 million products, To solve the very problem. The goal is to classify products containing multiple images into one of 5270 categories. This thesis proposes, implements and experimentally evaluates deep neural network architecture for classification of non-food E-commerce products. To tackle the complexity of the task on available hardware, hierarchical architecture of neural networks that exploits existing category taxonomy is proposed. The hierarchical architecture achieved the Top-1 accuracy of 0.61061. It has been found, that specific networks in hierarchical architecture can be successfully transferred onto similar datasets, by transferring network that learned on books onto different book dataset. The transfered model performed better than the same model pre-trained on ImageNet dataset.
Kolekce
- Diplomové práce - 13133 [495]