LaserNet:一種高效的自動駕駛概率三維目標探測器
上圖為自適應NMS。在兩輛車并排放置的情況下,左邊的虛線描述了產(chǎn)生的一組可能的預測。為了確定邊界框是否封裝了唯一的對象,使用預測的方差(如中間所示)來估計最壞情況下的重疊(如右圖所示)。在本例中,由于實際重疊小于估計的最壞情況重疊,因此將保留這兩個邊界框。
上圖為在訓練集和驗證集上的邊界框上的預測分布的校準的圖。結果表明,該模型不能學習KITTI上的概率分布,而能夠學習較大的ATG4D上的分布。
【實驗結果】
上表顯示了與其他最先進的方法相比,LaserNet在驗證集上的結果。像KITTI基準一樣,我們計算了汽車0.7 IoU和自行車及行人0:5 IoU的平均精度(AP)。在這個數(shù)據(jù)集上,LaserNet在0-70米范圍內(nèi)表現(xiàn)優(yōu)于現(xiàn)有的最先進的方法。此外,LaserNet在所有距離上都優(yōu)于LiDAR-only方法,只有在附加圖像數(shù)據(jù)提供最大價值的長距離上,車輛和自行車上的LiDAR-RGB方法優(yōu)于LaserNet。
對ATG4D數(shù)據(jù)集進行消融研究,結果如上表所示。
預測概率分布。預測概率分布最大的改進是預測邊界框架的分布。當僅預測平均邊界框時,公式(6)為簡單平均,公式(9)為框角損失。此外,邊界框的得分在本例中是類概率。實驗結果表明,性能上的損失是由于概率與邊界框架的準確性沒有很好地相關性導致的。
圖像形成:Velodyne 64E激光雷達中的激光器并不是均勻間隔的。通過使用激光id將點映射到行,并在傳感器捕獲數(shù)據(jù)時直接處理數(shù)據(jù),可以獲得性能上的提高。
均值漂移聚類:每個點獨立地預測邊界框的分布,通過均值漂移聚類將獨立的預測組合起來實現(xiàn)降噪。
非極大值抑制:當激光雷達的點稀疏時,有多個邊界框的配置可以解釋觀測到的數(shù)據(jù)。通過預測各點的多模態(tài)分布,進一步提高了該方法的查全率。在生成多模態(tài)分布時,使用具有嚴格閾值的NMS是不合適的;蛘,我們可以使用軟NMS來重新評估置信度,但是這打破了對置信度的概率解釋。通過自適應NMS算法,保持了概率解釋,并獲得了更好的性能。
對于自動駕駛而言,運行時性能同樣重要。上表比較了LaserNet(在NVIDIA 1080Ti GPU上測量)和KITTI上現(xiàn)有方法的運行時的性能。Forward Pass是指運行網(wǎng)絡所花費的時間,除Forward Pass外,總時間還包括預處理和后處理。由于在一個小的密集的范圍視場內(nèi)處理,LaserNet比目前最先進的方法快兩倍。
使用訓練集中的5,985個掃描點訓練網(wǎng)絡,并保留其余的掃描以進行驗證。使用與之前相同的學習時間表對網(wǎng)絡進行5萬次迭代訓練,并在單個GPU上使用12個批處理。為了避免在這個小的訓練集上過度擬合,采用數(shù)據(jù)增強手段隨機翻轉范圍圖像,并在水平維度上隨機像素移動。在這樣一個小的數(shù)據(jù)集中,學習邊界框上的概率分布,特別是多模態(tài)分布是非常困難的。因此,訓練網(wǎng)絡只檢測車輛并預測邊界框上的單峰概率分布。如上表所示,我們的方法在這個小數(shù)據(jù)集上的性能比當前最先進的鳥瞰圖檢測器差。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預約>> OFweek 2025具身智能機器人產(chǎn)業(yè)技術創(chuàng)新應用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題