侵權(quán)投訴
訂閱
糾錯
加入自媒體

自動駕駛汽車如何準確識別小物體?

自動駕駛汽車想要在道路上安全行駛,需要識別的東西遠比我們所知道的諸如紅綠燈、行人、車輛等復(fù)雜得多。其中有一個是我們經(jīng)常會忽略,但同樣非常重要的障礙物,那就是小物體,像是地面上常見的小坑、碎石、塑料袋、紙箱角落、掉落的車載零件,甚至是一只小鳥或小貓,都可能對車輛的行駛安全與乘坐舒適性造成影響。

小物體檢測聽起來“小事兒一樁”,但實際難度會高很多。小物體具有目標體積小、與背景對比弱、遮擋嚴重、在不同光照和天氣下表現(xiàn)各異等特征,而且在發(fā)現(xiàn)時已距離非常近了,常需要極低的延遲就決定躲避或減速,這給自動駕駛系統(tǒng)提出了非常高的要求,那自動駕駛汽車在遇到小物體的時候,是如何準確識別的?

感知硬件的必要性

聊到自動駕駛,一定離不開傳感器,相機因為分辨率高、成本低、能提供豐富的紋理和顏色信息,是檢測小物體的主力。把鏡頭換成更高像素、采用更窄的近距離視場或者多個短焦攝像頭組合,都能增加小物體在圖像中占比,從而更容易被檢測器捕捉到。但相機在弱光、逆光和大雨雪中表現(xiàn)會急劇下降。激光雷達(LiDAR)提供了直接的深度測量,能幫助判斷障礙物是否是真實物體以及其三維尺寸,但對小物體的點云回波可能稀疏或根本無回波,特別是遠距離或低反射率物體,所能得到的回波更是微乎其微。毫米波雷達對小塑料、紙張等非金屬目標通常無能為力,但對散落的金屬碎片或車輛零件有一定補充價值。超聲波在近距離(幾米內(nèi))對軟性或低矮物體靈敏,是泊車和低速情況下的好幫手。還有一些如紅外/熱成像能在夜間突出生物目標,事件相機能夠?qū)焖僮兓木置嬉詷O低延遲捕捉邊界,這些特殊傳感器在特定場景有獨特作用。

當然,為了精確感知到小物體,在選擇傳感器時并不能只考慮傳感器的能力,還有很多細節(jié)需要考慮,相機與LiDAR的安裝高度、俯仰角會影響對近地小物體的感知覆蓋;鏡頭選擇(廣角或窄角)以及畸變校正會決定小物體在圖像中的形態(tài)表達;傳感器清潔(擋風玻璃、LiDAR蓋板)和防凍措施也會直接關(guān)系到夜間或惡劣天氣的檢測能力。這時就可以引入自檢模塊,持續(xù)監(jiān)控傳感器健康,當某個傳感器的置信度下降時自動調(diào)整融合策略,同時告知上層決策降低速度或把駕駛權(quán)限交還給人類。

為了實現(xiàn)更加精準的識別,感知融合是非常重要的一環(huán)。把LiDAR的稀疏點云投影到圖像平面,可以在圖像上得到稀疏深度點,作為額外通道輸入給檢測網(wǎng)絡(luò);反過來,圖像檢測結(jié)果可以限制點云聚焦區(qū),從而提高點云模型對小物體的敏感度(Frustum-based方法就是這么干的)。此外,雷達數(shù)據(jù)的速度信息可以幫助區(qū)分靜止的垃圾與正在滾動的障礙物,熱成像能在夜間把動物與背景區(qū)分開來。多模態(tài)融合的難點在于對齊(時間戳同步、外參內(nèi)參標定)、置信度建模以及在模態(tài)缺失時的退化策略。有技術(shù)提出使用一種“模態(tài)優(yōu)先級”邏輯,即在視覺良好時優(yōu)先以相機為主,在夜間或大霧天則把熱像或雷達權(quán)重抬高,而在近距離停車/低速場景下,超聲波數(shù)據(jù)被賦予最高優(yōu)先級。

算法對于識別依然重要

想要實現(xiàn)精準識別,除了感知外,更重要的還有算法。曾幾何時,目標檢測靠手工特征+分類器,面對小目標普遍乏力,F(xiàn)代自動駕駛更多依賴深度學習,但直接把通用目標檢測網(wǎng)絡(luò)(比如早期的YOLO、SSD)拿來套用也不足以處理路面小物體。小目標的關(guān)鍵問題是,特征信息在網(wǎng)絡(luò)傳遞過程中容易丟失。當輸入分辨率、或特征圖尺度過小,小物體的特征就被下采樣吞掉了。為了彌補這一點,常用的策略包括保留高分辨率分支、使用特征金字塔(Feature Pyramid Network, FPN)來匯聚不同尺度的信息,采用空間金字塔池化、多尺度訓練以及專門為小目標優(yōu)化的檢測頭。

近年來興起的anchor-free方法、以及Transformer框架(如DETR類模型)也在不斷改進各尺度之間的建模能力,但它們對訓練數(shù)據(jù)和算力要求高。對小物體特別有效的技巧還包括,在訓練時對小目標進行過抽樣(讓模型看到更多小目標樣本)、使用焦點損失(Focal Loss)緩解正負樣本不平衡、引入上下文模塊(因為很多小物體難以從局部判斷,周圍語義和道路結(jié)構(gòu)常常是重要線索)、以及用可變形卷積或注意力機制提升對不規(guī)則形態(tài)的響應(yīng)能力。

時間維度是另一個強有力的工具。單幀圖像里一個不起眼的小紙袋可能看不出什么,但通過連續(xù)幀的運動信息、光流、或基于跟蹤的策略,就可以把“短暫的噪點”演變?yōu)榉(wěn)定的目標。常見的做法就是把檢測和跟蹤結(jié)合,先用檢測器在每一幀產(chǎn)生候選,再用輕量級跟蹤器(例如基于卡爾曼濾波和外觀關(guān)聯(lián)的SORT/DeepSORT思想)在時間上鏈接目標軌跡,從而用運動一致性來濾掉偶發(fā)誤報并且增強小物體置信度。還有更先進的做法是構(gòu)建時空網(wǎng)絡(luò),直接對多幀輸入進行端到端推斷,讓模型學會把跨幀的微弱線索整合起來。

小物體本身在自然采集中往往是長尾分布,即絕大多數(shù)幀里沒有稀有的小物體,這就會導(dǎo)致訓練數(shù)據(jù)里小物體樣本不足。為此,行業(yè)里普遍使用數(shù)據(jù)增強和合成數(shù)據(jù)來補樣本。有一種簡單但有效的做法是“copy-paste”,也就是把標注好的小物體裁剪出來,按合理的物理規(guī)則粘貼到其他場景中,保持遮擋與陰影一致性以減少域差異。更進一步的做法就是使用模擬器生成合成數(shù)據(jù),模擬不同天氣、不同路面、不同攝像頭參數(shù)下的小物體表現(xiàn)。還有一些技術(shù)細節(jié)會顯著提升檢測率,比如在訓練時使用高分辨率輸入、在數(shù)據(jù)增強里有意放大小物體、以及在訓練損失中對小目標增加權(quán)重。標注本身對小物體也更考驗審校質(zhì)量,標注框要足夠緊、類別標簽和元數(shù)據(jù)(反光、材質(zhì)、固定/移動)要準確,以便訓練出能區(qū)分細微差別的模型。

為了能夠讓自動駕駛汽車真實上路,對于小物體的檢測還要考慮計算和延遲約束。自動駕駛系統(tǒng)對實時性要求極高,檢測模型必須在有限算力下完成推理并輸送給規(guī)劃模塊。常見的辦法包括模型壓縮(剪枝、蒸餾、量化)、把繁重的檢測放在邊緣GPU上而把更高層決策放在車端CPU上,以及采用多階段流程,先用一個極輕量的快速篩查網(wǎng)絡(luò)做高召回檢測(允許較多誤報),然后把篩查結(jié)果送到更精細但慢一些的網(wǎng)絡(luò)做精確識別與分類。對于小物體尤其重要的是在保證高召回的前提下控制誤報率,因為虛假避讓會影響流暢性。為此,系統(tǒng)里常會加入置信度后處理和多模態(tài)確認策略,確保只有在至少兩個模態(tài)或時間上穩(wěn)定出現(xiàn)時才觸發(fā)緊急規(guī)避動作。

路面小坑、路面裂縫與低矮凸起這類問題,有時屬于“語義級”的路面檢測,與傳統(tǒng)的物體檢測有所不同。為此很多技術(shù)方案中會額外訓練專門的路面質(zhì)量模型,使用語義分割或深度回歸來估計路面高度場與凹坑深度。這種方法往往要結(jié)合車輛自身的慣性測量單元(IMU)和懸掛傳感器數(shù)據(jù),當車輪經(jīng)過坑洼引發(fā)的振動與加速度突變與視覺/攝像頭檢測到的路面形態(tài)相吻合時,可以更可靠地識別出“真實的坑洞”。同樣地,某些車隊或地圖服務(wù)會長期積累路面缺陷的高精度地圖,通過先驗地圖與在線感知對比來提示已知坑洞的位置,從而提前規(guī)劃繞行或減速。

最后的話

從長遠看,有幾類技術(shù)方向會進一步提升小物體檢測能力。一是傳感器硬件的改進,更高分辨率的LiDAR、短距高密度固態(tài)雷達、事件相機與主動照明結(jié)合,都會直接提高小目標的可觀測性。二是算法層面的專門設(shè)計,為小物體設(shè)計的微尺度檢測模塊、結(jié)合Transformer的時空模型、以及更好的自監(jiān)督表示學習可以減少對大量標注樣本的依賴。三是利用模擬與合成數(shù)據(jù)進行大規(guī)模預(yù)訓練,再在真實數(shù)據(jù)上做少量微調(diào),以實現(xiàn)更好的域遷移能力。四是邊緣計算與異構(gòu)計算協(xié)同,讓復(fù)雜模型在保證延遲的同時提升檢測精度。

當然,我們一定要明白,任何感知系統(tǒng)都不是完美的,系統(tǒng)設(shè)計要假設(shè)感知會出錯,并把這種不確定性納入決策。對小物體而言,最穩(wěn)妥的做法不是把所有東西都“確定檢測”出來再決策,而是在檢測不確定時采取保守策略,也就是立刻完成減速、拉開車距、優(yōu)先保證乘客與周圍人的安全。如果是在低速城市場景,可以適當放慢車速,從而換取更高的安全邊際;在高速上則更可以依賴高精地圖與車隊協(xié)同感知來降低突發(fā)小物體的暴露概率。

總的來說,小物體檢測是個跨越硬件、數(shù)據(jù)、算法與系統(tǒng)工程的綜合問題?恳豁梿我患夹g(shù)很難把它完全解決,現(xiàn)實的做法是多模態(tài)傳感器融合、時空信息整合、專門的小目標網(wǎng)絡(luò)優(yōu)化、以及將工程級的冗余與退化策略結(jié)合起來。未來,隨著傳感器成本的下降、模擬訓練的成熟、以及更高效的時空深度學習模型出現(xiàn),我們會看到自動駕駛系統(tǒng)在面對那些原先容易忽略的小坑小物體時變得越來越穩(wěn)健。但在此之前,謹慎、分級、可解釋并可驗證的策略仍然是確保行駛安全的核心原則。

-- END --

       原文標題 : 自動駕駛汽車如何準確識別小物體?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號