Učení reprezentací s omezenou supervizí pro vyhledávání ochranných známek
Representation learning for trademark search with limited supervision
Typ dokumentu
diplomová prácemaster thesis
Autor
Pavel Šuma
Vedoucí práce
Tolias Georgios
Oponent práce
Shekhovtsov Oleksandr
Studijní obor
Umělá inteligenceStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce si klade za cíl navrhnout metody pro rozpoznávání vzájemně podobných obrázků ochranných známek. Zakódováním vstupních obrázků do vektorových reprezentací lze podobné ochranné známky najít pomocí jednoduchého vyhledávání v euklidovském prostoru. Pro získání těchto reprezentací se používá hluboká konvoluční neuronová síť. S využitím paradigmatu přenosu znalostí je v práci prozkoumáno a porovnáno několik síťových architektur, předem natrénovaných v souvisejících doménách. Nejvýkonnější z modelů je dále dotrénován pomocí způsobů učení metrik. Pro účely trénování sítí byla vytvořen nová anotovaná datová sada, skládající se z více než dvou tisíc obrázků ochranných známek. Prokázané případy konfliktních ochranných známek jsou vzácné a ruční anotace velkého množství dat je pomalá a zdlouhavá. Z tohoto důvodu práce také navrhuje několik metod pro učení s omezenou supervizí, vhodných pro hluboké učení metrik, které snižují požadavky na data a lépe připravují řešení pro možné aplikace v reálném životě. Všechny metody jsou vyhodnoceny na standardních datových sadách obrázků \linebreak ochranných známek. This thesis aims to design methods for recognizing and retrieving similar trademark images from large databases. By embedding the input images into real-valued vector representations, the most similar trademarks can be derived with a simple Euclidean search. Acquiring these representations is done with the help of a deep convolutional neural network. Following a transfer learning paradigm, several network architectures pre-trained on related domains are studied and compared. On top of that, the best performing model is further fine-tuned in a metric learning fashion. A new annotated dataset consisting of more than two thousand trademark images was created for the purpose of the network training. Ground truth evidence for conflicting trademarks is scarce and manually annotating large amounts of data is slow and tedious. For this reason, the thesis also proposes various semi-supervised approaches suitable for deep metric learning to reduce the data requirements and better prepare the solution for possible real-world applications. Both supervised and semi-supervised methods are evaluated on standard trademark benchmark datasets.
Kolekce
- Diplomové práce - 13136 [833]