Improving Detection by Exploiting Dynamics in the Lidar Data

Vylepšení detekcí pomocí modelování dynamiky v lidarových datech

Research Projects

Organizational Units

Journal Issue

Abstract

Detekce dynamických objektů z 3D mračna bodů (PCL) je zásadní pro mnoho moderních problémů, jako jsou například detekce kolize pro samořiditelná auta nebo pohybující se roboty. V dnešní době dominují v těchto úlohách supervizované modely. Tyto modely vyžadují značné množství anotovaných dat a anotace lidarového snímku je velmi časově náročná. Tato práce navrhuje nesupervizovaný přístup neběžící v reálném čase pro detekci dynamických objektů, který se zaměřuje na vysokou preciznost a který je schopen generovat anotace. Dále tato práce zkoumá využití těchto vygenerovaných anotací při trénování supervizovaného modelu. Vyhodnocujeme Principal Component Analysis (PCA), Random Sample Consensus (RANSAC), metodu založenou na vzdálenostech a metodu Sloupců pro odstranění země. Odstranění země je důležitý krok pro správné prostorové oddělení objektů, což vede k lepší segmentaci a detekci objektů. V neposlední řadě navrhujeme novou semi-supervizovanou metodu. Provedeme segmentaci na dvou po sobě jdoucích snímcích, určíme korespondence mezi těmito snímky a vynutíme stejnou klasifikaci pro odpovídající body. Výsledky modelu natrénovaném na kombinaci našich automaticky vygenerovaných a menší části originálních anotacích překonávají model plně naučený na ručně vytvořeních anotacích.

Detecting dynamic objects from a 3D Point Cloud (PCL) is crucial for many modern problems, such as collision detection for self-driving cars or mobile robotics. Currently, this field is dominated by supervised methods. However, they require a lot of labeled data for training, and labeling a PCL is very time and resource-consuming. This thesis proposes an offline unsupervised approach for dynamic object detection, focusing on high precision, that can generate labels. It then explores how supervised models can benefit from those automatically-generated labels. We evaluate Principal Component Analysis (PCA), Random Sample Consensus (RANSAC), range image-based method, and pillars method for ground removal, which is crucial for good spatial separation of objects resulting in better segmentation and object detection. Lastly, we propose a new semi-supervised method. We perform segmentation on two consecutive frames, find point mapping between the two frames and enforce the same classification for the corresponding points. The results of a model trained on automatically-generated labels together with a mixed fraction of ground truth surpass the fully learned detector with fewer annotations needed.

Description

Citation

Endorsement

Review

Supplemented By

Referenced By