Unsupervised Approaches for 4D Panoptic Segmentation in LiDAR Driving Scenes

Nesupervizované přístupy pro 4D panoptickou segmentaci LiDARových dat autonomního řízení

Authors

Supervisors

Reviewers

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Research Projects

Organizational Units

Journal Issue

Abstract

4D panoptická segmentace, kombinující sémantickou a instanční segmentaci pro časové sekvence LiDARových dat, je zásadní pro robustní vnímání prostředí v autonomním řízení. Supervizované přístupy vyžadují nákladné anotované datasety, což omezuje jejich využití pro neznámé scénáře. Tato práce představuje FlowSeg4D, nesupervizovanou metodu pro online 4D panoptickou segmentaci, která snižuje potřebu anotací a dosahuje konkurenceschopných výsledků. FlowSeg4D integruje nesupervizované techniky pro odhad scene flow s metodami shlukování, zajišťujícími časovou konzistenci a přesnou asociaci instancí, dále využívá síť WaffleIron pro sémantickou segmentaci. Na datasetech SemanticKITTI dosahuje FlowSeg4D LSTQ skóre 46.9 a asociačního skóre až 73.0 pro vybrané třídy, což je srovnatelné se supervizovanými metodami. Výsledky ukazují na proměnlivý vliv scene flow a silnou schopnost zobecnění na neznámých datech, jak dokazují testy na datasetu PONE. Pokroky v nesupervizované 4D panoptické segmentaci přispívají k rozvoji cenově dostupných systémů pro autonomní řízení.

4D panoptic segmentation, which combines semantic and instance segmentation across LiDAR sequences, is crucial for enabling robust scene understanding in autonomous driving. Supervised methods rely on costly labeled datasets, limiting scalability across diverse driving scenarios. This thesis proposes FlowSeg4D, an unsupervised framework for online 4D panoptic segmentation that minimizes annotation requirements while achieving competitive performance. FlowSeg4D integrates unsupervised scene flow estimation with clustering techniques to ensure temporal consistency and accurate instance association, leveraging the WaffleIron model for semantic segmentation. Evaluated on SemanticKITTI, FlowSeg4D achieves LSTQ of 46.9 and association scores up to 73.0 for specific classes, rivaling supervised methods. Key findings highlight the inconsistent impact of scene flow and demonstrate strong generalization on out-of-distribution data, as evidenced by results on the PONE dataset. By advancing unsupervised 4D panoptic segmentation, this work contributes to scalable, cost-effective perception systems for safer autonomous driving.

Description

Citation

Endorsement

Review

Supplemented By

Referenced By