自動駕駛中感知、決策、控制都起到什么作用?
要把自動駕駛講清楚,最直觀的比喻是把整車當作一個“會開車的人”,感知相當于眼睛和耳朵,負責把外界變成內(nèi)部能理解的信息;決策像大腦,判斷“接下來怎么做”;控制則像手和腳,把決策變成具體動作。這個比喻看似簡單,其實每一層都有大量細節(jié)、復雜性和工程權(quán)衡。
自動駕駛感知層
感知系統(tǒng)最重要的就是傳感器。自動駕駛常見的傳感器群包括攝像頭、激光雷達(LiDAR)、毫米波雷達、超聲波傳感器和定位慣導系統(tǒng)(GNSS+IMU)。攝像頭給出豐富的顏色和紋理信息,適合識別交通標志、車道線和信號燈,但受光照、雨霧和逆光影響較大。激光雷達提供精確的三維點云,測距精度高,能清晰描述障礙物的形狀,但在雪、雨或強反射表面上會有噪聲,并且成本與數(shù)據(jù)量較高。毫米波雷達穿透能較好,能穩(wěn)定測量物體的相對速度,常用來補充在惡劣天氣中攝像頭和激光雷達受限時的信息。超聲波用于短距離近場探測,如自動泊車場景。GNSS+IMU提供車輛的全局位置和短時姿態(tài),但在隧道、高樓林立的市區(qū)或地下停車場會失準,因此通常與車載視覺/雷達細粒度定位或高精地圖配合使用。理解每種傳感器的強弱,是合理設(shè)計感知系統(tǒng)的第一步。
把傳感器數(shù)據(jù)變成可用信息,需要經(jīng)過若干階段。首先是數(shù)據(jù)預處理,這其中包括時間同步、坐標轉(zhuǎn)換和濾波。時間同步是基礎(chǔ)但經(jīng)常被低估的問題,因為攝像頭、雷達、IMU的采樣頻率與時延不同,如果不把數(shù)據(jù)對齊,感知模塊會把同一物體“看到”成不同位置。坐標轉(zhuǎn)換則把所有傳感器的數(shù)據(jù)投影到統(tǒng)一的坐標系(通常是車輛坐標系或世界坐標系),便于后續(xù)融合。噪聲去除、點云下采樣、圖像去霧和偽影濾除等都屬于預處理范疇,目的是降低輸入端的干擾。
預處理后要進行的就是檢測、語義分割、跟蹤與定位。檢測和語義分割通常基于深度學習模型處理攝像頭像素或激光點云特征,目標是把“像素/點”轉(zhuǎn)成“物體”的表示。點云檢測有一系列方法,從傳統(tǒng)基于體素/網(wǎng)格的點云處理,到最近幾年流行的基于點網(wǎng)絡(luò)、柱狀體(pillar)或多視圖融合的端到端網(wǎng)絡(luò)。攝像頭的檢測則常用卷積神經(jīng)網(wǎng)絡(luò)做目標檢測和分割,再結(jié)合幾何方法估計深度。跟蹤模塊將每幀的檢測結(jié)果關(guān)聯(lián)成時間連續(xù)的軌跡,常見的做法是在檢測后的狀態(tài)上運行卡爾曼濾波或更復雜的貝葉斯濾波器,同時結(jié)合匈牙利算法或深度學習相似度度量做數(shù)據(jù)關(guān)聯(lián)。跟蹤能平滑檢測噪聲、處理短時遮擋,并為預測模塊提供歷史軌跡。
感知里另一個重要環(huán)節(jié)是預測,這里所說的預測,并不是“把未來完全預測出來”,而是給出帶不確定性的未來分布。最簡單的預測是假定目標勻速或勻加速,但在真實道路中行人、騎行者和其他車輛會有復雜的轉(zhuǎn)向、剎車或交互行為。因此在實際設(shè)計時會混合使用物理模型、基于軌跡的啟發(fā)式方法和學習型模型。學習型方法包括循環(huán)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)、Transformers等,它們能夠?qū)W習交通參與者在不同語義場景下的典型軌跡模式。更進一步的交互式預測會把其他主體的可能反應也考慮進來,輸出諸如“若我減速,對方有x%概率做y行為”的條件式預測。這其中的關(guān)鍵在于,感知模塊的輸出通常不是“單一真值”,而是狀態(tài)估計加上不確定度(概率或置信度),這些不確定信息必須傳遞給決策層,否則決策會“高估”感知的準確性。
現(xiàn)在感知系統(tǒng)越來越依賴深度學習,在實際工程中常常把幾何算法和學習方法結(jié)合使用以兼顧效率與可解釋性。例如用傳統(tǒng)的點云配準算法做粗對齊,再把對齊后的數(shù)據(jù)送入學習模型做語義提取;或在攝像頭里用多目幾何恢復深度之后再用學習網(wǎng)絡(luò)做檢測。這樣做的好處是能利用物理先驗來約束學習模型,減少對海量標注數(shù)據(jù)的依賴,并在極端場景下有可解釋的操作行為。另一個實際問題是計算資源與延遲,點云和高分辨率相機數(shù)據(jù)量巨大,感知模塊要在有限算力下達成實時(通常10–30Hz),這促使大家使用模型剪枝、蒸餾、量化以及硬件加速(GPU/TPU/專用加速器)來壓縮推理時間。
在這中間有個容易被忽略但非常重要的點,那就是感知的錯誤模式。遮擋、逆光、強反射、路面鏡像、紡織物或交通錐的非典型外觀、雨雪顆粒回波等都會造成感知錯誤。為此系統(tǒng)必須在設(shè)計時就考慮不確定性傳播,如當感知給出的“行人置信度只有 0.6”時,決策層要相應保守;當定位相對高精地圖的匹配不穩(wěn)定時,車輛應降低速度并盡快進入安全模式。感知并不是單純輸出“物體在哪里”,而是把狀態(tài)、置信度和語義關(guān)鍵信息(例如“這是車輛還是自行車”)一起輸出,供決策層綜合判斷。
自動駕駛決策層
自動駕駛決策層通常分層處理,分別是從更高層的路徑規(guī)劃(route planning)到行為規(guī)劃(behavior planning),再到局部運動規(guī)劃(motion planning)。路徑規(guī)劃解決“從A點到B點應走哪條道路”,這部分和傳統(tǒng)導航類似,依賴路網(wǎng)圖和交通規(guī)則。行為規(guī)劃負責回答“在當前路段我應該做什么樣的駕駛行為”,比如是否變道、是否超車、是否在某處掉頭。局部運動規(guī)劃則把行為轉(zhuǎn)化為連續(xù)的、滿足動力學約束的時間-空間軌跡。把這三層分離有利于把復雜問題拆解,但也要注意交互與一致性,高層決定了一些不可逆的動作(例如進入匝道),一旦執(zhí)行,局部規(guī)劃和控制需要能可靠實現(xiàn)并處理外界反應。
行為規(guī)劃的實現(xiàn)方法多樣,早期工程做法偏重規(guī)則與狀態(tài)機,例如把交通規(guī)則、禮讓策略和一些經(jīng)驗規(guī)則寫死,行為邏輯用有限狀態(tài)機來實現(xiàn)。這種方法可解釋、易于驗證,但難以覆蓋復雜多變的場景。近年來,基于成本函數(shù)的優(yōu)化方法和學習型策略被廣泛研究。成本函數(shù)方法會定義一組目標和約束,例如安全距離、舒適度、時間效率、與交通規(guī)則的偏差等,然后在候選行為或軌跡集合中求最小代價解。強化學習或模仿學習的方法試圖從數(shù)據(jù)中直接學習到“如何決策”,在某些場景下能學出更靈活的駕駛策略,但其可解釋性與可驗證性仍是挑戰(zhàn)。因此在實際產(chǎn)品中,常使用混合策略,即把規(guī)則作為硬約束,把學習模型或優(yōu)化器作為軟策略決策器,并在顯著不確定時回退到規(guī)則基線。
局部運動規(guī)劃是決策到控制的橋梁,它要在給定行為下生成一條可追蹤的時間序列軌跡,通常需要考慮車輛動力學、路面曲率、障礙物位置和預測軌跡等因素。軌跡生成有采樣-評估的方法,也有優(yōu)化求解的方法。采樣方法先生成多個可行軌跡樣本,再基于成本函數(shù)評估并選取最優(yōu)樣本;這種方法實現(xiàn)簡單、容易并行化,但樣本覆蓋性影響結(jié)果。優(yōu)化方法(例如基于梯度的軌跡優(yōu)化或Model Predictive Control的前置規(guī)劃)則直接把軌跡求解為連續(xù)優(yōu)化問題,能夠更精細地處理約束但計算量大。有技術(shù)提出把快速采樣器與局部優(yōu)化結(jié)合,先生成候選軌跡(保證實時性),再用快速優(yōu)化做局部修正以提高可行性與舒適度。
決策模塊的另一個關(guān)鍵挑戰(zhàn)是交互。道路上的其他主體會根據(jù)你的動作做出反應,因此一個好決策不僅要預測別人會怎么走,還要評估別人對自己動作的反應。交互式?jīng)Q策可以借助博弈論、多智能體強化學習或條件預測模型,但這些方法復雜且難以保證收斂到可驗證的策略。因此工程實現(xiàn)上往往選擇折中,在常規(guī)場景使用預測模型加權(quán)評估候選軌跡,并在風險升高或預測不確定度大時降速或保守避讓,從而在保證安全的同時不犧牲效率過多。
決策還必須與法規(guī)、倫理和功能安全規(guī)范對齊。不同國家和地區(qū)對自動駕駛行為有不同的法律約束,例如對變道禮讓、紅綠燈處理、學校區(qū)域限速等都有明確規(guī)范。決策系統(tǒng)要把這些硬約束嵌入策略里,如ISO 26262會要求對導致潛在危險的故障模式做風險評估并設(shè)計冗余/故障響應機制。從技術(shù)角度考慮,一個常見的做法是在決策模塊里加入安全保護層(safety envelope),它在局部規(guī)劃輸出后作為最后一道檢查,確保軌跡在例如不突破最低剎車距離、保持橫向穩(wěn)定限值等任何已知的安全約束內(nèi),如果檢測到違反則拒絕該軌跡并觸發(fā)緊急減速或?俊
自動駕駛控制層
決策的輸出是期望軌跡或期望速度曲線,這些被送到控制層去執(zhí)行?刂频娜蝿帐前岩(guī)劃的期望軌跡跟蹤成車輛實際運動?刂品譃榭v向(速度/加減速)和橫向(轉(zhuǎn)向)兩個主要維度。有些系統(tǒng)把兩者合并進一個聯(lián)合控制器,有些系統(tǒng)分別設(shè)計縱橫向控制器再做協(xié)調(diào)?刂破饕幚淼默F(xiàn)實問題包括執(zhí)行器非線性(油門踏板與車體前進的非線性關(guān)系、制動踏板與制動力的非線性)、執(zhí)行器時延(踏板命令到實際加速存在延遲)、以及車輛動力學隨載荷和輪胎狀態(tài)變化。
縱向控制里常見的技術(shù)有PID和模型預測控制(MPC)。PID簡單可靠,參數(shù)調(diào)教成熟,適合常規(guī)高速巡航;MPC更適合在需要考慮動力學約束與預測信息時使用,因為MPC可以在優(yōu)化中直接引入可控約束(例如最大加速度、乘客舒適度權(quán)重)并生成未來一段時間的控制序列。但MPC計算復雜,需要實時求解優(yōu)化問題,對算力要求高。橫向控制常見算法包括幾何方法(如pure pursuit)、基于狀態(tài)誤差的控制(如Stanley 控制器)、以及同樣使用MPC的模型預測控制。純幾何方法實現(xiàn)簡單且在低速下表現(xiàn)良好,MPC在高速或動態(tài)耦合情況下表現(xiàn)更穩(wěn)健。
控制的設(shè)計不只是選擇一種算法那么簡單,還包括前饋+反饋結(jié)構(gòu)、延遲補償、以及對執(zhí)行器和輪胎模型的非線性補償。前饋控制利用規(guī)劃軌跡的曲率給出預期轉(zhuǎn)向角,減少穩(wěn)態(tài)誤差;反饋控制則基于實際誤差做修正。延遲補償可以通過預測未來的車輛狀態(tài)或在規(guī)劃時把已知延遲納入軌跡,實現(xiàn)在實際執(zhí)行中減少超前或滯后導致的偏差。更復雜的系統(tǒng)還會把輪胎力學、車身橫擺動力學等模型引入控制器以提高極限條件下的穩(wěn)定性。
控制器還要與車輛的底層電子穩(wěn)定系統(tǒng)(ESP/ESC)、制動防抱死系統(tǒng)(ABS)等協(xié)同工作。緊急制動時制動力分配、ABS的激活以及ESC的側(cè)向力控制都會影響車輛實際行為,因此控制系統(tǒng)通常需要與底層車輛控制單元(VCU)緊密集成,或者通過低級接口讓車輛底層的安全系統(tǒng)優(yōu)先保證車體穩(wěn)定性。
三者結(jié)合的必要性
把感知、決策、控制三層放到一起,系統(tǒng)架構(gòu)上看起來就像是一條流水線,但工程實現(xiàn)中會并行設(shè)計多個冗余路徑。為了保證功能安全,常見做法是傳感器冗余(同一類型或不同類型傳感器重復布局)、計算冗余(主控和備份控制器分開工作并相互監(jiān)測)和軟件冗余(主算法和簡化硬規(guī)則并行檢查),低延遲安全通道(watchdog)也會在主鏈路失效時立刻干預。
測試與驗證是整個系統(tǒng)開發(fā)中最消耗資源但又最關(guān)鍵的部分。感知需要大量標注數(shù)據(jù)覆蓋不同天氣、光照、道路材料和稀有事件。單純依靠大規(guī)模道路測試既昂貴又難以覆蓋所有角落,因此工業(yè)界廣泛使用仿真平臺做海量場景測試,其中包括可編程的交通參與者行為、極端天氣模擬和傳感器物理仿真。決策需要進行交互式場景的長尾測試,評估在罕見場景中的策略魯棒性。運動規(guī)劃和控制則要做閉環(huán)仿真加真實車輛道路測試,尤其是邊界條件下的跟蹤誤差與穩(wěn)定性驗證。硬件在環(huán)(HIL)和車輛在環(huán)(VIL)測試是把軟件與真實執(zhí)行器、電控單元耦合起來驗證延遲和非線性影響的重要手段。當然,最終的道路驗證(含試驗場和公開道路)仍是不可或缺的步驟,但要在前述多層次仿真和工況驗證基礎(chǔ)上有選擇性地放大測試覆蓋。
綜上所述,自動駕駛的感知、決策與控制是一個高度耦合的系統(tǒng)工程。感知負責把復雜、噪聲且有不確定性的外界信息轉(zhuǎn)換為具有語義和概率描述的內(nèi)部狀態(tài);決策基于這些狀態(tài)做出策略選擇,并生成滿足動力學和安全約束的軌跡;控制將軌跡精確執(zhí)行到車輛上,同時應對執(zhí)行器非線性與延遲。每一層既有經(jīng)典算法的成熟路徑,也在迅速被學習型方法推動邊界,但是想要讓自動駕駛落地最重要的始終是魯棒性、可驗證性與安全性。理解三層的分工并把接口上的不確定性顯式處理好,是把研究成果轉(zhuǎn)化為可靠產(chǎn)品的關(guān)鍵。
-- END --
原文標題 : 自動駕駛中感知、決策、控制都起到什么作用?
圖片新聞
最新活動更多
推薦專題
- 1 從技術(shù)狂歡到安全合規(guī) :2025上半年自動駕駛?cè)谫Y進入“場景閉環(huán)”新周期
- 2 飛行汽車:開啟規(guī);囷w
- 3 智駕技術(shù)戰(zhàn):特斯拉、華為、理想、小鵬和比亞迪,誰才是未來?
- 4 最嚴輔助駕駛新規(guī),兩部門再劃監(jiān)管、宣傳紅線
- 5 奧迪A5L Sportback全新登場,上市亮點探秘
- 6 百度蘿卜快跑:從北大嶼山到香港島:自動駕駛在香港的 “三級跳” 啟示錄
- 7 道通科技,全球汽車診斷市場龍頭
- 8 自動駕駛RoboTaxi“闖五關(guān)”:混合運營才能扛起商業(yè)化大旗?蘿卜快跑、小馬智行、文遠知行、特斯拉、Waymo怎么選?
- 9 狂飆 836%!小馬智行與文遠知行,自動駕駛界的 “瑜亮之爭”,誰能成為王者?
- 10 一周股評|為何資本市場不買“央企第三極”的賬?