中科院自動化所和圖森聯(lián)合開源FSD V2:通過虛擬體素改進的全稀疏三維物體檢測
#論文##開源# arxiv 2023|中科院自動化所和圖森聯(lián)合開源FSD V2:通過虛擬體素改進的全稀疏三維物體檢測 【FSD V2: Improving Fully Sparse 3D Object Detection with Virtual Voxels】 文章鏈接:[2308.03755] FSD V2: Improving Fully Sparse 3D Obj... 開源代碼:GitHub - tusen-ai/SST: Codes for “Fully Sparse 3D ... 基于LiDAR的全稀疏架構引起了越來越多的關注。FSDv1作為代表性的工作在效能和效率方面表現(xiàn)出色,盡管具有復雜的結構和手工設計。在本文中,我們介紹了FSDv2,這是FSDv1的升級版本,旨在簡化以前的FSDv1,同時消除其手工設計的實例級表示引入的歸納偏差,從而提高更好的通用適用性。為此,我們引入了虛擬體素的概念,取代了FSDv1中基于聚類的實例分割。虛擬體素不僅解決了全稀疏檢測器中臭名昭著的中心特征缺失問題,還賦予了框架更加優(yōu)雅和簡化的方法。 因此,我們開發(fā)了一系列補充虛擬體素概念的組件,包括虛擬體素編碼器、虛擬體素混合器和虛擬體素分配策略。通過經驗驗證,我們證明虛擬體素機制在功能上類似于FSDv1中的手工聚類,同時更具通用性。我們在三個大規(guī)模數據集上進行了實驗證明:Waymo開放數據集、Argoverse 2數據集和nuScenes數據集。我們的結果展示了在這三個數據集上的SOTA,突顯了FSDv2在長距離場景中的優(yōu)越性,并且其通用適用性可以在各種場景中實現(xiàn)具有競爭力的性能。此外,我們提供了全面的實驗分析,以闡明FSDv2的工作原理。