訂閱
糾錯
加入自媒體

深蘭科技|目標檢測二十年間的那些事兒

2020-07-31 10:00
深蘭科技
關注

本文主要參考自文獻[1]:Zhengxia Zou, Zhenwei Shi, Member, IEEE, Yuhong Guo, and Jieping Ye, Object Detection in 20 Years: A Survey Senior Member, IEEE

過去二十年中與 “ 目標檢測 ” 相關的出版物數(shù)量的增長

二十年

計算機視覺領域中有幾個基本的任務:圖像分類[3]、目標檢測[4]、實例分割[5]及語義分割[6],其中目標檢測作為計算機視覺中最基本的任務在近年來引起了廣泛關注。某種意義上,它在過去二十年內(nèi)的發(fā)展也是計算機視覺發(fā)展史的縮影。如果我們將今天基于深度學習的目標檢測技術比作一場“熱兵器革命”,那么回顧20年前的技術時即可窺探“冷兵器”時代的智慧。

目標檢測是一項計算機視覺任務。正如視覺對于人的作用一樣,目標檢測旨在解決計算機視覺應用中兩個最基本的問題:1. 該物體是什么?2. 該物體在哪里?當然,聰明的人可能會立即想到第三個問題:“該物體在干什么?”這即是更進一步的邏輯及認知推理,這一點在近年來的目標檢測技術中也越來越被重視。不管怎樣,作為計算機視覺的基本任務,它也是其他計算機視覺任務的主要成分,如實例分割、圖像字幕、目標跟蹤等。

從應用的角度來看,目標檢測可以被分為兩個研究主題:“ 通用目標檢測(General Object Detection) ” 及 “檢測應用(Detection Applications)” ,前者旨在探索在統(tǒng)一的框架下檢測不同類型物體的方法,以模擬人類的視覺和認知;后者是指特定應用場景下的檢測,如行人檢測、人臉檢測、文本檢測等。

近年來,隨著深度學習技術[7]的快速發(fā)展,為目標檢測注入了新鮮血液,取得了顯著的突破,也將其推向了一個前所未有的研究熱點。目前,目標檢測已廣泛應用于自動駕駛、機器人視覺、視頻監(jiān)控等領域。

二十年間的發(fā)展

如下圖所示,以2014年為分水嶺,目標檢測在過去的二十年中可大致分為兩個時期:2014年前的“傳統(tǒng)目標檢測期”及之后的“基于深度學習的目標檢測期”。接下來我們詳細談論兩個時期的發(fā)展。

傳統(tǒng)檢測

早期的目標檢測算法大多是基于手工特征構建的。由于當時缺乏有效的圖像表示,人們別無選擇,只能設計復雜的特征表示及各種加速技術對有限的計算資源物盡其用。

(1) Viola Jones檢測器

18年前,P. Viola和M. Jones在沒有任何約束(如膚色分割)的情況下首次實現(xiàn)了人臉的實時檢測[8][9]。他們所設計的檢測器在一臺配備700MHz Pentium III CPU的電腦上運行,在保持同等檢測精度的條件下的運算速度是其他算法的數(shù)十甚至數(shù)百倍。這種檢測算法以共同作者的名字命名為“Viola-Jones (VJ) 檢測器”以紀念他們的重大貢獻。

VJ檢測器采用最直接的檢測方法,即滑動窗口(slide window):查看一張圖像中所有可能的窗口尺寸和位置并判斷是否有窗口包含人臉。這一過程雖然聽上去簡單,但它背后所需的計算量遠遠超出了當時計算機的算力。VJ檢測器結合了 “ 積分圖像 ”、“ 特征選擇 ” 和 “ 檢測級聯(lián) ” 三種重要技術,大大提高了檢測速度。

1)積分圖像:這是一種計算方法,以加快盒濾波或卷積過程。與當時的其他目標檢測算法一樣[10],在VJ檢測器中使用Haar小波作為圖像的特征表示。積分圖像使得VJ檢測器中每個窗口的計算復雜度與其窗口大小無關。

2)特征選擇:作者沒有使用一組手動選擇的Haar基過濾器,而是使用Adaboost算法從一組巨大的隨機特征池 (大約18萬維) 中選擇一組對人臉檢測最有幫助的小特征。

3)檢測級聯(lián):在VJ檢測器中引入了一個多級檢測范例 ( 又稱“檢測級聯(lián)”,detection cascades ),通過減少對背景窗口的計算,而增加對人臉目標的計算,從而減少了計算開銷。

1  2  3  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號