Identity tracking in multi-view camera surveillance system

Sledování objektů mezi vícero scénami se zachováním jejich indentity

Research Projects

Organizational Units

Journal Issue

Abstract

Re-identifikace lidí a vozidel je rychle se rozvíjející oblastí pro analýzu rostoucí sbírky videozáznamů městského sledování z důvodu bezpečnosti. Vzhledem k tomu, že na těchto videozáznamech jsou většinou vozidla i chodci, bylo by vhodné sjednotit re-identifikaci chodců a re-identifikaci vozidel pomocí jednoho softwarového systému. Kvůli rozdílnému vnímání lidí a vozidel vyžaduje re-identifikace vozidel obvykle pokročilejší neuronovou síť než re-identifikace osob. To je způsobeno tím, že při změně úhlu pohledu na vozidlo dochází k obrovským změnám tvaru vozidla, a proto neuronová síť musí být dostatečně robustní. Motivováni úspěchem funkce triplet loss v obou doménách navrhujeme architekturu neuronové sítě, která nevyžaduje specializovaný návrh datového toku, na kterém je aplikována. Vytváříme dvě funkce, abychom minimalizovali vzdálenosti uvnitř třídy a maximalizovali vzdálenosti mezi třídami. Následně tyto vzdálenosti spojíme s tripletovou ztrátovou hodnotou a vytvoříme tak novou ztrátovou funkci. Navíc navrhujeme rozšířenou metodu s prostorově časovým omezením pro sledování více kamer. Navrhovaný rámec je komplexně vyhodnocen na datových sadách Market-1501, CUHK03, DukeMTMC4ReID, VeRI a VehicleReId a překonává nejmodernější metody u obou úkolů.

Person and vehicle re-identification (re-ID) are important challenges for the analysis of the burgeoning collection of urban surveillance videos. As this data is usually populated with both vehicles and pedestrians, it would be preferable to unify the tasks under one framework. Due to the contrasting composition of humans and vehicles, vehicle re-identification typically requires a more advanced network that is robust to drastic shape changes as the viewing angle is altered. Motivated by the success of the triplet loss function in both domains, we propose a re-ID framework which does not require any specialised design for the data stream on which it is applied. We create two functions to minimise the intra-class distance and maximise the inter-class distance respectively and combine them with the triplet loss to create our novel loss function. Moreover, we proposed an extended method with the spatio-temporal constraint for multiple camera tracking. The proposed framework is comprehensively evaluated on the Market-1501, CUHK03, DukeMTMC4ReID, VeRI and VehicleReId data sets and outperforms state-of-the-art methods on both tasks.

Description

Citation

Endorsement

Review

Supplemented By

Referenced By