Sledování objektů mezi vícero scénami se zachováním jejich indentity
Identity tracking in multi-view camera surveillance system
Typ dokumentu
diplomová prácemaster thesis
Autor
Jandová Kateřina
Vedoucí práce
Krček Jan
Oponent práce
Kopřiva Štěpán
Studijní obor
Umělá inteligenceStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Re-identifikace lidí a vozidel je rychle se rozvíjející oblastí pro analýzu rostoucí sbírky videozáznamů městského sledování z důvodu bezpečnosti. Vzhledem k tomu, že na těchto videozáznamech jsou většinou vozidla i chodci, bylo by vhodné sjednotit re-identifikaci chodců a re-identifikaci vozidel pomocí jednoho softwarového systému. Kvůli rozdílnému vnímání lidí a vozidel vyžaduje re-identifikace vozidel obvykle pokročilejší neuronovou síť než re-identifikace osob. To je způsobeno tím, že při změně úhlu pohledu na vozidlo dochází k obrovským změnám tvaru vozidla, a proto neuronová síť musí být dostatečně robustní. Motivováni úspěchem funkce triplet loss v obou doménách navrhujeme architekturu neuronové sítě, která nevyžaduje specializovaný návrh datového toku, na kterém je aplikována. Vytváříme dvě funkce, abychom minimalizovali vzdálenosti uvnitř třídy a maximalizovali vzdálenosti mezi třídami. Následně tyto vzdálenosti spojíme s tripletovou ztrátovou hodnotou a vytvoříme tak novou ztrátovou funkci. Navíc navrhujeme rozšířenou metodu s prostorově časovým omezením pro sledování více kamer. Navrhovaný rámec je komplexně vyhodnocen na datových sadách Market-1501, CUHK03, DukeMTMC4ReID, VeRI a VehicleReId a překonává nejmodernější metody u obou úkolů. Person and vehicle re-identification (re-ID) are important challenges for the analysis of the burgeoning collection of urban surveillance videos. As this data is usually populated with both vehicles and pedestrians, it would be preferable to unify the tasks under one framework. Due to the contrasting composition of humans and vehicles, vehicle re-identification typically requires a more advanced network that is robust to drastic shape changes as the viewing angle is altered. Motivated by the success of the triplet loss function in both domains, we propose a re-ID framework which does not require any specialised design for the data stream on which it is applied. We create two functions to minimise the intra-class distance and maximise the inter-class distance respectively and combine them with the triplet loss to create our novel loss function. Moreover, we proposed an extended method with the spatio-temporal constraint for multiple camera tracking. The proposed framework is comprehensively evaluated on the Market-1501, CUHK03, DukeMTMC4ReID, VeRI and VehicleReId data sets and outperforms state-of-the-art methods on both tasks.
Kolekce
- Diplomové práce - 13136 [833]