Algoritmy pro video analýzu chování zákazníků před vstupem do retailové pobočky
Algorithms for video analysis of customer behavior in front of retail store
Type of document
bakalářská prácebachelor thesis
Author
David Mašek
Supervisor
Brchl Lukáš
Opponent
Hrabák Pavel
Field of study
Znalostní inženýrstvíStudy program
Informatika 2009Institutions assigning rank
katedra aplikované matematikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Cílem této práce je návrh frameworku pro sledování osob na záznamu z jedné staticky umístěné kamery, s vedlejším cílem extrakce věku a pohlaví sledovaných osob. Práce je zaměřena na prostředí maloobchodu. Hlavní algoritmus funguje na principu sledování na základě detekcí. Asociace detekcí k identitám je založena na informacích o poloze a vzhledu získaných z konvolučních neuronových sítí. Kalman filtr je použit pro robustní reprezentaci identit a jejich aktualizaci. Algoritmus vyhodnocujeme s několika modely pro detekci na datasetu získaném z cílového prostředí. Také vyhodnocujeme zlepšení výkonu zíkané použitím optimalizačního frameworku TensorRT. Výsledná aplikace dosahuje 0.91 MOTA na testovacím datasetu, se snímkovací frekvencí 13 snímků za sekundu na zařízení Jetson NX. This thesis aims to design a framework for tracking people based on a stream from a single stationary camera, with the secondary goal of extracting age and gender information for tracked people. The focus of this work is on the retail shop environment. The main algorithm follows the tracking by detection approach. The matching of detections to tracks is done based on spatial and visual information from convolutional neural networks. Kalman filter is used for robust state representation and updates. We evaluate the algorithm with multiple detector models on a dataset collected from the target environment. We also evaluate the performance improvements from using the TensorRT optimization framework. The resulting application achieves 0.91 MOTA on the testing dataset, with frame rate of 13 FPS on the Jetson NX platform.
Collections
- Bakalářské práce - 18105 [295]