Učení reprezentací s omezenou supervizí pro vyhledávání ochranných známek

Tato práce si klade za cíl navrhnout metody pro rozpoznávání vzájemně podobných obrázků ochranných známek. Zakódováním vstupních obrázků do vektorových reprezentací lze podobné ochranné známky najít pomocí jednoduchého vyhledávání v euklidovském prostoru. Pro získání těchto reprezentací se používá hluboká konvoluční neuronová síť. S využitím paradigmatu přenosu znalostí je v práci prozkoumáno a porovnáno několik síťových architektur, předem natrénovaných v souvisejících doménách. Nejvýkonnější z modelů je dále dotrénován pomocí způsobů učení metrik. Pro účely trénování sítí byla vytvořen nová anotovaná datová sada, skládající se z více než dvou tisíc obrázků ochranných známek. Prokázané případy konfliktních ochranných známek jsou vzácné a ruční anotace velkého množství dat je pomalá a zdlouhavá. Z tohoto důvodu práce také navrhuje několik metod pro učení s omezenou supervizí, vhodných pro hluboké učení metrik, které snižují požadavky na data a lépe připravují řešení pro možné aplikace v reálném životě. Všechny metody jsou vyhodnoceny na standardních datových sadách obrázků \linebreak ochranných známek.

This thesis aims to design methods for recognizing and retrieving similar trademark images from large databases. By embedding the input images into real-valued vector representations, the most similar trademarks can be derived with a simple Euclidean search. Acquiring these representations is done with the help of a deep convolutional neural network. Following a transfer learning paradigm, several network architectures pre-trained on related domains are studied and compared. On top of that, the best performing model is further fine-tuned in a metric learning fashion. A new annotated dataset consisting of more than two thousand trademark images was created for the purpose of the network training. Ground truth evidence for conflicting trademarks is scarce and manually annotating large amounts of data is slow and tedious. For this reason, the thesis also proposes various semi-supervised approaches suitable for deep metric learning to reduce the data requirements and better prepare the solution for possible real-world applications. Both supervised and semi-supervised methods are evaluated on standard trademark benchmark datasets.

Keywords

hluboké učení metrik, učení s omezenou supervizí, vyhledávání obrázků ochranných známek, deep metric learning, trademark image retrieval, semi-supervised learning

Permanent link

http://hdl.handle.net/10467/92728

Rights/License

A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.

Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.

Collections

Master Theses - 13136

Full item page

Representation learning for trademark search with limited supervision