CVPR2020 | 基于點的3D單階段對象檢測器3DSSD
論文模型
融合采樣
3D 目標檢測有基于點和基于體素兩種框架,前者更加耗時,由候選生成與預測細化兩個階段組成。
在第一個階段,SA 用于降采樣以獲得更高的效率以及擴大感受野,F(xiàn)P 用來為降采樣過程中丟掉的點傳播特征。在第二階段,一個優(yōu)化模塊最優(yōu)化 RPN 的結(jié)果以獲得更準確的預測。SA 對于提取點的特征是必需的。但 FP 和優(yōu)化模塊會限制效率。
首先最容易想到的是直接用 SA 的采樣點進行預測,但如果用 D-FPS 的采樣方法會使得采樣點中有很多背景點,這是由于 D-FPS 是在歐式空間中進行最遠點采樣,并不會考慮到該點的任何屬性特征,從而極大的降低預測效果。
因此本文引入了 F-FPS,以達到保留更多前景點信息的目的,同時為了防止保留很多同一個目標的點導致精度下降,作者將 F-FPS 與 D-FPS 相結(jié)合,同時考慮歐式空間和特征空間的采樣信息,通過 F-FPS 和 D-FPS 各選擇一半的點的方法以保證分類的效果。
邊框預測網(wǎng)絡
已有的工作是在得到每個點的特征后接三層 SA 分別用于中心點選擇、周圍點特征的提取以及生成語義信息。本文為進一步降低計算成本,候選中心點的生成是直接在 F-FPS 采樣后進行的。F-FPS 采樣的點由于比 D-FPS 的點更加可能是前景點,所以候選點僅僅只是在 F-FPS 的點上生成。接著作者將這些候選中心點當作候選生成層的中心點。最后根據(jù)候選中心點領域選擇從 F-FPS 和 D-FPS 中采樣得到的代表點進行局部特征提取,采用 MLP 進行特征提取。
在 3D 目標檢測中,需要在場景中每隔一段距離就設置一個錨,這些錨有幾個不同的朝向,所以每增加一個類別需要線性的增加錨,為了降低計算量,本文的回歸頭是無錨的。由于沒有每個點的先驗方位,在方位角回歸中采用分類和回歸公式的混合表達式。
在訓練過程中,需要一種分配策略來為每個候選點打標簽。在 2D 但階段檢測中,IoU 閾值或 mask 可以用于標簽分配。在 3DLIDAR 數(shù)據(jù)上,由于點云數(shù)據(jù)都在物體的表面,因此他們的中心性非常接近的,這會導致不太可能從這些點得到好的預測。因此之前生成候選點的時候要選取采樣后再朝中心靠近的點而不是直接用原始采樣點。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字

暫無評論

暫無評論
最新活動更多
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 3 宇樹機器人撞人事件的深度剖析:六維力傳感器如何成為人機安全的關鍵屏障
- 4 清華跑出具身智能獨角獸:給機器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實用主義
- 7 騰訊 Q2 財報亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號,AI還有哪些機會
- 9 蘋果把身家押在Siri上:一場輸不起的自我革命
- 10 共探合作新機遇!江門市新會區(qū)(深圳)“AI + 機器人” 產(chǎn)業(yè)對接會成功舉辦