訂閱
糾錯
加入自媒體

CVPR2020|深蘭科技挑戰(zhàn)復雜場景,獲霧天條件目標檢測挑戰(zhàn)賽冠軍

2020-07-02 15:08
深蘭科技
關注

03賽題特點&主要工作

在這次挑戰(zhàn)賽中,主要的難點包含以下幾個方面:

1.可視條件差、圖像模糊

可視條件差是這個賽道核心問題,霧天收集的數據特點就是能見度低,圖像模糊,遠處的物體不容易被檢測與識別,容易造成大量的目標漏檢、誤檢,從而導致mAP效果下降。

2.圖片數量少,數據分布不平衡

總共只有4000多張帶標注的圖片,增加了訓練難度,再加上數據分布的不均衡,很難劃分一個具有代表性的驗證集,很可能導致模型不具有泛化能力,在新的測試集上表現會不如預期。

檢測器

我們先通過常規(guī)檢測所累積的經驗構造出一個baseline:

Baseline=Backbone+DCN[1]+FPN[2]+CascadeRCNN[3]

這套pipeline,也是去年冠軍團隊所使用的方法,在這里我們沿用這套算法,以此為基礎進行改進。

通過觀察實驗結果發(fā)現,模型誤檢情況遠多于漏檢,經常出現一個目標有多個檢測結果,并且這些檢測結果之間無法使用nms去除。歸納為兩方面原因。

1.模型自身能力不足,回歸分類能力差,導致大量誤檢;

2.負樣本不足,由于樣本個數限制,模型會在一些模棱兩可的地方檢測出置信度較高的結果,無法通過閾值去處理這些誤檢結果。

根據目前結果做了一下幾個方面的改進:

1.DoubleHeads[6]

當需要提升模型能力時,有2個比較簡單高效的方法,一是使用更強的backbone,二是提高RCNN中分類檢測head的能力,通過實驗比對,我們最終使用了doublehead的結構(如下圖所示)。

▲DoubleHeads

Doublehead采用分而治之的思想,將原始head解耦為2個獨立的分支,針對不同的需求設計head結構,通過對比實驗可發(fā)現:使用FC-h(huán)ead做分類,Conv-h(huán)ead做回歸,可以得到最好的效果。

因為分類更多地需要語義信息,所以使用全連接層。而坐標框回歸需要更多的空間信息,因此使用卷積層。當然這種方法會增加計算量。在平衡速度和準確率的情況下,最終我們選擇了3個殘差2個Non-local共5個模塊。

<上一頁  1  2  3  4  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號