美國(guó)國(guó)家工程院院士、福特技術(shù)研究員 Dimitar Filev : 用于智慧出行的智能車輛系統(tǒng)
當(dāng)前智能駕駛汽車算法和解決方案面臨的挑戰(zhàn)如下:
1、能學(xué)習(xí)特定駕駛員和環(huán)境、擁有最少的手工標(biāo)定和標(biāo)簽數(shù)據(jù)的車載或者云平臺(tái)的實(shí)時(shí)解決方案;
2、相比較監(jiān)督式學(xué)習(xí)更傾向于無(wú)監(jiān)督和半監(jiān)督強(qiáng)化學(xué)習(xí);
3、包含認(rèn)知信息和物理模型的混合AI算法;
4、AI算法可解釋、可驗(yàn)證;
5、擁有魯邦特性并且可以自評(píng)估;
6、維護(hù)成本低。
下面介紹一些有效的解決方案,每當(dāng)我們遇到一個(gè)復(fù)雜系統(tǒng)時(shí),我們會(huì)努力學(xué)習(xí)用一些復(fù)雜函數(shù)去近似這個(gè)系統(tǒng)例如神經(jīng)網(wǎng)絡(luò),這是其中一種方法。另一種方法使用許多簡(jiǎn)單的小的子系統(tǒng)進(jìn)行組合模擬復(fù)雜系統(tǒng)。
非監(jiān)督的演化聚類算法可以實(shí)現(xiàn)實(shí)時(shí)的學(xué)習(xí)對(duì)系統(tǒng)的狀態(tài)空間進(jìn)行預(yù)測(cè),一個(gè)重要的例子是對(duì)引擎特性具有自適應(yīng)標(biāo)定和控制能力的在線空時(shí)濾波器;旌像R爾科夫模型對(duì)于目的地和路徑的預(yù)測(cè)也是非常有效的。神經(jīng)網(wǎng)絡(luò)的可解釋性是近年來(lái)的熱點(diǎn)話題,強(qiáng)化學(xué)習(xí)可以使用神經(jīng)網(wǎng)絡(luò)將狀態(tài)空間映射到行為空間,這是個(gè)非線性映射。這種非線性映射可不可以使用其他的映射來(lái)近似并且時(shí)刻解釋的呢?
基于強(qiáng)化學(xué)習(xí)的控制器將狀態(tài)空間映射到行為空間,而使用模糊控制器基于規(guī)則的模型則是一種通用的近似器,通過(guò)將強(qiáng)化學(xué)習(xí)Agent仿真為黑盒子動(dòng)態(tài)系統(tǒng),它可以被有限級(jí)的“if-then”規(guī)則近似和解釋。以強(qiáng)化學(xué)習(xí)車輛跟蹤控制為例,跟車問(wèn)題基本是是一種自適應(yīng)巡航問(wèn)題,后車需要保持與前車的安全距離、控制好各自的車速以及加速度,傳統(tǒng)方法中車速控制器基于吉布斯分布、加速度控制器使用智能駕駛模型(Intelligent Driving Model,IDM)建模,福特使用強(qiáng)化學(xué)習(xí),分別建立速度、加速度以及距離的獎(jiǎng)勵(lì)函數(shù),最大化獎(jiǎng)勵(lì)函數(shù)得到的結(jié)果達(dá)到甚至超過(guò)傳統(tǒng)方法。
在得到加速度結(jié)果后,他們使用聚類算法以相對(duì)速度和相對(duì)距離作為輸入,預(yù)測(cè)加速度作為輸出,對(duì)數(shù)據(jù)進(jìn)行聚類來(lái)近似強(qiáng)化學(xué)習(xí)控制器,強(qiáng)化學(xué)習(xí)器被近似為可解釋的PI控制器的非線性組合的形式,組合系數(shù)為各數(shù)據(jù)點(diǎn)到聚類中心距離負(fù)值的Softmax函數(shù)。
擬合效果基本達(dá)到原始強(qiáng)化學(xué)習(xí)其的性能,但是推理時(shí)間從強(qiáng)化學(xué)習(xí)器的0.3ms降低到了非線性組合的0.13ms。最后,對(duì)演化系統(tǒng)地總結(jié)如下:
1、使用演化聚類和核粒化的方法講一個(gè)復(fù)雜系統(tǒng)實(shí)時(shí)分解為多個(gè)相互重疊的子區(qū)域;
2、實(shí)時(shí)同步學(xué)習(xí)系統(tǒng)架構(gòu)以及局部子系統(tǒng)的參數(shù);
3、對(duì)具有多個(gè)操作模式和多元化行為的系統(tǒng)實(shí)時(shí)建模;
4、特定的機(jī)器學(xué)習(xí)技巧(無(wú)監(jiān)督聚類與監(jiān)督學(xué)習(xí)的組合);
5、反映人類從現(xiàn)實(shí)中學(xué)習(xí)、總結(jié)、管理知識(shí)的能力。
我們?cè)诖颂岬降难莼到y(tǒng)是多個(gè)子系統(tǒng)的組合,它的功能非常強(qiáng)大,包含了監(jiān)督學(xué)習(xí)方法和非監(jiān)督學(xué)習(xí)方法,可應(yīng)用在實(shí)時(shí)的無(wú)人駕駛大數(shù)據(jù)處理中。大數(shù)據(jù)、物聯(lián)網(wǎng)以及AI技術(shù)的快速發(fā)展為智能汽車提供了更多的解決方案,AI算法則需要具備更多的人性化、自適應(yīng)和最小標(biāo)定以適應(yīng)嵌入式實(shí)施的需求也很廣泛,智能汽車的發(fā)展為傳統(tǒng)AI算法的改進(jìn)提供了新的發(fā)展方向,傳統(tǒng)AI算法應(yīng)與基于規(guī)則的系統(tǒng)、認(rèn)知知識(shí)和基于第一性原理的模型相結(jié)合,此外,認(rèn)知模型對(duì)統(tǒng)計(jì)機(jī)器學(xué)習(xí)的近似使得傳統(tǒng)機(jī)器學(xué)習(xí)算法變得可解釋和性能的可升。
以上就是我的報(bào)告,非常感謝大家

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車研發(fā)中心重磅落地,寶馬家門口“搶人”
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 6 特朗普要求英特爾首位華人 CEO 辭職
- 7 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 8 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線
- 9 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 10 騰訊米哈游押寶的中國(guó)AI應(yīng)用,正在海外悶聲發(fā)財(cái)