Deep Neural Networks for Classification of Product Images

Klasifikace obrázků produktů za použití hlubokých neuronových sítí

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Research Projects

Organizational Units

Journal Issue

Abstract

Vysoké množství produktu a kategorií dostupných v soucasných elektronických obchodech zpusobují, že validace dat je pracná a drahá. Proto vzniká snaha automatizovat validaci správného umístnení produktu ve své kategorii. Francouzský elektronický obchod CDiscount proto vyhlásil soutež hostovanou na Kaggle, kde zverejnil dataset s více než 7 miliony produkty. Cílem je klasifikovat produkty obsahující jeden ci více obrázku do jedné z 5270 kategorií. Tato diplomová práce navrhuje, implementuje a experimentálne overuje architekturu hluboké neuronové síte pro kalsifikaci zboží elektronických obchodu s výjimkou potravin. Pro zmírnení výpocetní nárocnosti pro použití na dostupném hardwaru je navržena hierarchická architektura neuronových sítí, která využívá existující hierarchickou taxonomii kategorií. Hierarchická architektura dosáhla Top-1 skóre 0.61061. Pretrénováním neuronové síte klasifikující obaly knih bylo overeno, že specifický model, jenž je soucástí hierarchické architektury, muže být úspešne pretrénován pro podobnou trénovací množinu. Model predtrénovaný na knihách dosáhl lepšího výsledku, než totožný model naucený na ImageNet datasetu.

The high numbers of products and categories on today E-commerce sites render validation of the data as labor intensive and expensive task. Therefore, there is a recent push to automate validation of correct placement of product in category. The French E-commerce company CDiscount has launched Kaggle competition, sharing huge dataset of over 7 million products, To solve the very problem. The goal is to classify products containing multiple images into one of 5270 categories. This thesis proposes, implements and experimentally evaluates deep neural network architecture for classification of non-food E-commerce products. To tackle the complexity of the task on available hardware, hierarchical architecture of neural networks that exploits existing category taxonomy is proposed. The hierarchical architecture achieved the Top-1 accuracy of 0.61061. It has been found, that specific networks in hierarchical architecture can be successfully transferred onto similar datasets, by transferring network that learned on books onto different book dataset. The transfered model performed better than the same model pre-trained on ImageNet dataset.

Description

Citation

Endorsement

Review

Supplemented By

Referenced By