Unsupervised Approaches for 4D Panoptic Segmentation in LiDAR Driving Scenes
Nesupervizované přístupy pro 4D panoptickou segmentaci LiDARových dat autonomního řízení
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date
Abstract
4D panoptická segmentace, kombinující sémantickou a instanční segmentaci pro časové sekvence LiDARových dat, je zásadní pro robustní vnímání prostředí v autonomním řízení. Supervizované přístupy vyžadují nákladné anotované datasety, což omezuje jejich využití pro neznámé scénáře. Tato práce představuje FlowSeg4D, nesupervizovanou metodu pro online 4D panoptickou segmentaci, která snižuje potřebu anotací a dosahuje konkurenceschopných výsledků. FlowSeg4D integruje nesupervizované techniky pro odhad scene flow s metodami shlukování, zajišťujícími časovou konzistenci a přesnou asociaci instancí, dále využívá síť WaffleIron pro sémantickou segmentaci. Na datasetech SemanticKITTI dosahuje FlowSeg4D LSTQ skóre 46.9 a asociačního skóre až 73.0 pro vybrané třídy, což je srovnatelné se supervizovanými metodami. Výsledky ukazují na proměnlivý vliv scene flow a silnou schopnost zobecnění na neznámých datech, jak dokazují testy na datasetu PONE. Pokroky v nesupervizované 4D panoptické segmentaci přispívají k rozvoji cenově dostupných systémů pro autonomní řízení.
4D panoptic segmentation, which combines semantic and instance segmentation across LiDAR sequences, is crucial for enabling robust scene understanding in autonomous driving. Supervised methods rely on costly labeled datasets, limiting scalability across diverse driving scenarios. This thesis proposes FlowSeg4D, an unsupervised framework for online 4D panoptic segmentation that minimizes annotation requirements while achieving competitive performance. FlowSeg4D integrates unsupervised scene flow estimation with clustering techniques to ensure temporal consistency and accurate instance association, leveraging the WaffleIron model for semantic segmentation. Evaluated on SemanticKITTI, FlowSeg4D achieves LSTQ of 46.9 and association scores up to 73.0 for specific classes, rivaling supervised methods. Key findings highlight the inconsistent impact of scene flow and demonstrate strong generalization on out-of-distribution data, as evidenced by results on the PONE dataset. By advancing unsupervised 4D panoptic segmentation, this work contributes to scalable, cost-effective perception systems for safer autonomous driving.
4D panoptic segmentation, which combines semantic and instance segmentation across LiDAR sequences, is crucial for enabling robust scene understanding in autonomous driving. Supervised methods rely on costly labeled datasets, limiting scalability across diverse driving scenarios. This thesis proposes FlowSeg4D, an unsupervised framework for online 4D panoptic segmentation that minimizes annotation requirements while achieving competitive performance. FlowSeg4D integrates unsupervised scene flow estimation with clustering techniques to ensure temporal consistency and accurate instance association, leveraging the WaffleIron model for semantic segmentation. Evaluated on SemanticKITTI, FlowSeg4D achieves LSTQ of 46.9 and association scores up to 73.0 for specific classes, rivaling supervised methods. Key findings highlight the inconsistent impact of scene flow and demonstrate strong generalization on out-of-distribution data, as evidenced by results on the PONE dataset. By advancing unsupervised 4D panoptic segmentation, this work contributes to scalable, cost-effective perception systems for safer autonomous driving.
Description
Keywords
4D panoptická segmentace, autonomní řízení, asociace instancí, LiDAR, nesupervizované učení, scene flow, segmentace instancí, sémantická segmentace, shlukování, sledování objektů, strojové učení, 4D Panoptic Segmentation, Autonomous Driving, Clustering, Instance Association, Instance segmentation, LiDAR, Machine Learning, Object Tracking, Scene Flow, Semantic Segmentation, Unsupervised Learning