CVPR2020 | 基于點的3D單階段對象檢測器3DSSD
論文模型
融合采樣
3D 目標檢測有基于點和基于體素兩種框架,前者更加耗時,由候選生成與預測細化兩個階段組成。
在第一個階段,SA 用于降采樣以獲得更高的效率以及擴大感受野,FP 用來為降采樣過程中丟掉的點傳播特征。在第二階段,一個優(yōu)化模塊最優(yōu)化 RPN 的結果以獲得更準確的預測。SA 對于提取點的特征是必需的。但 FP 和優(yōu)化模塊會限制效率。
首先最容易想到的是直接用 SA 的采樣點進行預測,但如果用 D-FPS 的采樣方法會使得采樣點中有很多背景點,這是由于 D-FPS 是在歐式空間中進行最遠點采樣,并不會考慮到該點的任何屬性特征,從而極大的降低預測效果。
因此本文引入了 F-FPS,以達到保留更多前景點信息的目的,同時為了防止保留很多同一個目標的點導致精度下降,作者將 F-FPS 與 D-FPS 相結合,同時考慮歐式空間和特征空間的采樣信息,通過 F-FPS 和 D-FPS 各選擇一半的點的方法以保證分類的效果。
邊框預測網絡
已有的工作是在得到每個點的特征后接三層 SA 分別用于中心點選擇、周圍點特征的提取以及生成語義信息。本文為進一步降低計算成本,候選中心點的生成是直接在 F-FPS 采樣后進行的。F-FPS 采樣的點由于比 D-FPS 的點更加可能是前景點,所以候選點僅僅只是在 F-FPS 的點上生成。接著作者將這些候選中心點當作候選生成層的中心點。最后根據候選中心點領域選擇從 F-FPS 和 D-FPS 中采樣得到的代表點進行局部特征提取,采用 MLP 進行特征提取。
在 3D 目標檢測中,需要在場景中每隔一段距離就設置一個錨,這些錨有幾個不同的朝向,所以每增加一個類別需要線性的增加錨,為了降低計算量,本文的回歸頭是無錨的。由于沒有每個點的先驗方位,在方位角回歸中采用分類和回歸公式的混合表達式。
在訓練過程中,需要一種分配策略來為每個候選點打標簽。在 2D 但階段檢測中,IoU 閾值或 mask 可以用于標簽分配。在 3DLIDAR 數據上,由于點云數據都在物體的表面,因此他們的中心性非常接近的,這會導致不太可能從這些點得到好的預測。因此之前生成候選點的時候要選取采樣后再朝中心靠近的點而不是直接用原始采樣點。

請輸入評論內容...
請輸入評論/評論長度6~500個字