CVPR2020|深蘭科技挑戰(zhàn)復雜場景,獲霧天條件目標檢測挑戰(zhàn)賽冠軍
03賽題特點&主要工作
在這次挑戰(zhàn)賽中,主要的難點包含以下幾個方面:
1.可視條件差、圖像模糊
可視條件差是這個賽道核心問題,霧天收集的數據特點就是能見度低,圖像模糊,遠處的物體不容易被檢測與識別,容易造成大量的目標漏檢、誤檢,從而導致mAP效果下降。
2.圖片數量少,數據分布不平衡
總共只有4000多張帶標注的圖片,增加了訓練難度,再加上數據分布的不均衡,很難劃分一個具有代表性的驗證集,很可能導致模型不具有泛化能力,在新的測試集上表現會不如預期。
檢測器
我們先通過常規(guī)檢測所累積的經驗構造出一個baseline:
Baseline=Backbone+DCN[1]+FPN[2]+CascadeRCNN[3]
這套pipeline,也是去年冠軍團隊所使用的方法,在這里我們沿用這套算法,以此為基礎進行改進。
通過觀察實驗結果發(fā)現,模型誤檢情況遠多于漏檢,經常出現一個目標有多個檢測結果,并且這些檢測結果之間無法使用nms去除。歸納為兩方面原因。
1.模型自身能力不足,回歸分類能力差,導致大量誤檢;
2.負樣本不足,由于樣本個數限制,模型會在一些模棱兩可的地方檢測出置信度較高的結果,無法通過閾值去處理這些誤檢結果。
根據目前結果做了一下幾個方面的改進:
1.DoubleHeads[6]
當需要提升模型能力時,有2個比較簡單高效的方法,一是使用更強的backbone,二是提高RCNN中分類檢測head的能力,通過實驗比對,我們最終使用了doublehead的結構(如下圖所示)。
▲DoubleHeads
Doublehead采用分而治之的思想,將原始head解耦為2個獨立的分支,針對不同的需求設計head結構,通過對比實驗可發(fā)現:使用FC-h(huán)ead做分類,Conv-h(huán)ead做回歸,可以得到最好的效果。
因為分類更多地需要語義信息,所以使用全連接層。而坐標框回歸需要更多的空間信息,因此使用卷積層。當然這種方法會增加計算量。在平衡速度和準確率的情況下,最終我們選擇了3個殘差2個Non-local共5個模塊。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
即日-9.16點擊進入 >> 【限時福利】TE 2025國際物聯網展·深圳站
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業(yè)年度評選
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業(yè)大會