商湯絕影CEO王曉剛:智能駕駛與智能座艙的發(fā)展路徑
在車(chē)展前的商湯絕影媒體溝通會(huì)上,商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯絕影CEO王曉剛深入探討了輔助駕駛與智能座艙的未來(lái)發(fā)展方向。
● 輔助駕駛正邁向生成式智能輔助駕駛階段,世界模型與強(qiáng)化學(xué)習(xí)的結(jié)合將突破人類(lèi)駕駛行為的局限,提升安全性和確定性。
● 智能座艙通過(guò)引入深度思考能力和多模態(tài)交互,致力于打造“家庭新成員”體驗(yàn),打破體驗(yàn)同質(zhì)化。
我們將從自動(dòng)駕駛和智能座艙兩個(gè)維度,結(jié)合王曉剛的觀點(diǎn),分析技術(shù)趨勢(shì)、行業(yè)挑戰(zhàn)及商湯絕影的戰(zhàn)略布局,展望智能汽車(chē)產(chǎn)業(yè)的未來(lái)。
01
輔助駕駛:
從端到端到生成式
智能駕駛的躍遷
輔助駕駛技術(shù)經(jīng)歷了從基于物理模型的規(guī)則階段到端到端數(shù)據(jù)驅(qū)動(dòng)階段的轉(zhuǎn)變。
端到端模型通過(guò)輸入圖像和視頻直接預(yù)測(cè)車(chē)輛行駛軌跡,模仿人類(lèi)駕駛行為。這一模式高度依賴(lài)數(shù)據(jù)量和質(zhì)量,尤其在復(fù)雜場(chǎng)景中,優(yōu)質(zhì)數(shù)據(jù)稀缺。
例如,90%的駕駛者在困難場(chǎng)景中可能選擇停車(chē),僅1%-10%的高水平數(shù)據(jù)具有學(xué)習(xí)價(jià)值,端到端模型存在不確定性:特定問(wèn)題場(chǎng)景難以復(fù)現(xiàn),模型更新后可能導(dǎo)致已解決場(chǎng)景的性能回退,統(tǒng)計(jì)性結(jié)果與自動(dòng)駕駛對(duì)安全性和確定性的高要求相悖。
輔助駕駛的下一階段是“生成式智能駕駛”,核心在于世界模型與強(qiáng)化學(xué)習(xí)的協(xié)同。
世界模型通過(guò)3D重建和物理建模,精準(zhǔn)模擬現(xiàn)實(shí)世界的物理定律、交通規(guī)則和運(yùn)動(dòng)規(guī)律,構(gòu)建類(lèi)似圍棋棋盤(pán)的“虛擬環(huán)境”,強(qiáng)化學(xué)習(xí)通過(guò)反復(fù)模擬問(wèn)題場(chǎng)景,優(yōu)化端到端模型,解決特定場(chǎng)景問(wèn)題并實(shí)現(xiàn)泛化,突破了人類(lèi)駕駛行為的上限,還降低了數(shù)據(jù)采集的成本和風(fēng)險(xiǎn)。
商湯絕影的“開(kāi)悟”世界模型已取得顯著成果,連續(xù)兩年在Waymo挑戰(zhàn)賽中奪冠。
2023年11月發(fā)布的1.0版本覆蓋多種場(chǎng)景,2025年升級(jí)至2.0,進(jìn)一步結(jié)合強(qiáng)化學(xué)習(xí),形成云端與端側(cè)協(xié)同的新范式,通過(guò)云端訓(xùn)練大模型并蒸餾至車(chē)端,適應(yīng)不同算力水平的芯片架構(gòu),云端研發(fā)的比重將持續(xù)增加,算力中心等基礎(chǔ)設(shè)施將成為競(jìng)爭(zhēng)關(guān)鍵。
生成式智能輔助駕駛依賴(lài)云端訓(xùn)練,但車(chē)端算力需求依然重要,算力與模型應(yīng)對(duì)復(fù)雜場(chǎng)景的能力呈正比。然而,類(lèi)似DeepSeek的MOE(混合專(zhuān)家模型)架構(gòu)通過(guò)優(yōu)化參數(shù)激活,顯著降低算力需求。
這種技術(shù)路線對(duì)車(chē)端部署大模型具有普適意義。商湯絕影通過(guò)MOE架構(gòu)和工程化優(yōu)化,在有限算力下實(shí)現(xiàn)高性能模型部署,為量產(chǎn)落地提供了可行路徑。
針對(duì)地平線創(chuàng)始人余凱“99%人類(lèi)數(shù)據(jù)不值得學(xué)習(xí)”的觀點(diǎn),王曉剛表示認(rèn)同其部分邏輯。
在端到端范式下,人類(lèi)駕駛數(shù)據(jù)多為簡(jiǎn)單場(chǎng)景,信息量低,而復(fù)雜場(chǎng)景數(shù)據(jù)質(zhì)量參差不齊。通過(guò)世界模型和仿真,商湯絕影能夠重復(fù)問(wèn)題場(chǎng)景并生成多樣化數(shù)據(jù),提升模型的確定性和安全性。
量產(chǎn)過(guò)程中,商湯結(jié)合自有采集數(shù)據(jù)與世界模型生成數(shù)據(jù),迭代優(yōu)化模型質(zhì)量,確保時(shí)空一致性和場(chǎng)景多樣性。
輔助駕駛安全性的提升離不開(kāi)艙駕融合和駕駛員監(jiān)控系統(tǒng)(DMS),DMS不僅需監(jiān)測(cè)駕駛員狀態(tài)(如疲勞、分心),還需通過(guò)3D視線追蹤(Gaze)精準(zhǔn)判斷其關(guān)注目標(biāo)。
在無(wú)保護(hù)左轉(zhuǎn)場(chǎng)景中,DMS可確認(rèn)駕駛員是否關(guān)注潛在風(fēng)險(xiǎn)車(chē)輛,從而決定采取激進(jìn)或保守的駕駛策略。商湯通過(guò)與廣汽、奇瑞、東風(fēng)一汽等車(chē)企合作,量產(chǎn)J6M智駕方案和端到端智駕方案,進(jìn)一步驗(yàn)證技術(shù)可靠性。
02
智能座艙:
從工具到家庭成員的體驗(yàn)升級(jí)
DeepSeek通過(guò)強(qiáng)化學(xué)習(xí)和思維鏈生成超越人類(lèi)知識(shí)的數(shù)據(jù),打破了語(yǔ)言模型的Scaling Law瓶頸,其表達(dá)生動(dòng)幽默,深受行業(yè)關(guān)注。
直接將DeepSeek接入座艙并不適合,座艙交互場(chǎng)景要求簡(jiǎn)潔高效,冗長(zhǎng)的推理過(guò)程和中間結(jié)果不適用于車(chē)內(nèi)環(huán)境。
商湯絕影基于DeepSeek的核心技術(shù),優(yōu)化SenseAuto-chat模型,結(jié)合多模態(tài)推理,打造“一句話頂一萬(wàn)句”的交互體驗(yàn),賦予座艙“有趣的靈魂”。智能座艙的同質(zhì)化問(wèn)題日益凸顯,傳統(tǒng)語(yǔ)言助手在交互能力上缺乏本質(zhì)提升。
● 商湯絕影提出“家庭新成員”理念,將座艙從問(wèn)答工具、功能助手升級(jí)為情感共情的伙伴。具體體現(xiàn)在以下技術(shù)突破:
◎ 無(wú)注冊(cè)人臉識(shí)別與記憶生成:通過(guò)對(duì)話自動(dòng)推斷用戶(hù)身份并記住面孔,結(jié)合互聯(lián)網(wǎng)信息和交互歷史生成個(gè)性化記憶,形成長(zhǎng)期共情。例如,機(jī)器人可根據(jù)用戶(hù)近期活動(dòng)主動(dòng)發(fā)起話題,縮短人車(chē)距離。◎ 免喚醒多人多輪對(duì)話:機(jī)器人時(shí)刻監(jiān)聽(tīng)多人對(duì)話,理解上下文并主動(dòng)參與討論,甚至化解矛盾,提供情感調(diào)和。這種能力適配座艙多人交互場(chǎng)景,顯著提升沉浸感。◎ 深度思考與多模態(tài)推理:商湯日日新6.0模型將DeepSeek的深度思考能力引入多模態(tài),結(jié)合視覺(jué)、語(yǔ)音等多維輸入,生成精準(zhǔn)幽默的表達(dá)。
商湯絕影發(fā)布行業(yè)首個(gè)車(chē)載AI OS基礎(chǔ)設(shè)施“絕影千機(jī)”,核心為AI內(nèi)核,包含多模態(tài)模型、記憶功能、MOE架構(gòu)和全時(shí)運(yùn)行能力,商湯聚焦AI相關(guān)技術(shù),與車(chē)企OS結(jié)合形成完整AI操作系統(tǒng),并引入第三方智能體構(gòu)建生態(tài)。
MOE架構(gòu)適配低算力芯片,支持從0.幾B到幾十B的模型部署,確保高效體驗(yàn)。
● 商湯通過(guò)3D視線追蹤、健康監(jiān)測(cè)(心跳、血氧、血壓)等技術(shù),拓展座艙功能。
◎ 3D Gaze可識(shí)別駕駛員注視的車(chē)外目標(biāo),支持自動(dòng)繳費(fèi)、拍照分享等創(chuàng)新應(yīng)用;
◎ 健康監(jiān)測(cè)則提供主動(dòng)關(guān)懷和安全預(yù)警,進(jìn)一步融合艙駕功能。
在國(guó)內(nèi)市場(chǎng)高度內(nèi)卷的背景下,商湯絕影積極配合車(chē)企出海,滿足2026年ENCAP對(duì)DMS和OMS的強(qiáng)制要求。
2024年,商湯已協(xié)助車(chē)企實(shí)現(xiàn)ENCAP最高分,未來(lái)將深化與合資和全球品牌合作,抓住海外市場(chǎng)對(duì)高階智駕和智能座艙的需求增長(zhǎng)。
小結(jié)
商湯絕影的戰(zhàn)略布局展現(xiàn)了其對(duì)自動(dòng)駕駛和智能座艙的深刻洞察,輔助駕駛領(lǐng)域,生成式智能駕駛通過(guò)世界模型和強(qiáng)化學(xué)習(xí)突破數(shù)據(jù)瓶頸,提升安全性和確定性;在智能座艙領(lǐng)域,“家庭新成員”理念以深度思考和多模態(tài)交互為核心,打破同質(zhì)化壁壘。
商湯通過(guò)AI內(nèi)核和操作系統(tǒng)生態(tài)建設(shè),聯(lián)合車(chē)企推動(dòng)技術(shù)落地,同時(shí)積極布局海外市場(chǎng),應(yīng)對(duì)全球合規(guī)需求。
原文標(biāo)題 : 商湯絕影CEO王曉剛:智能駕駛與智能座艙的發(fā)展路徑
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【在線研討會(huì)】普源精電--激光原理應(yīng)用與測(cè)試解決方案
-
精彩回顧立即查看>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
精彩回顧立即查看>> 【線上直播】新能源汽車(chē)熱管理行業(yè)應(yīng)用新進(jìn)展
-
精彩回顧立即查看>> 【線上直播】西門(mén)子電池行業(yè)研討會(huì)-P4B如何加速電池開(kāi)發(fā)
推薦專(zhuān)題
- 1 首份國(guó)家級(jí)自動(dòng)駕駛倫理指引發(fā)布
- 2 試駕奧迪Q6L e-tron:德系豪華基因與華為智駕的化學(xué)反應(yīng)
- 3 優(yōu)步Uber瘋搶中國(guó)無(wú)人車(chē)團(tuán)隊(duì),馬斯克急了?
- 4 特斯拉 Grok + FSD = VLA?
- 5 誰(shuí)在為智駕買(mǎi)單?城市NOA滲透背后的用戶(hù)分析
- 6 輔助駕駛強(qiáng)標(biāo)落地在即,汽車(chē)行業(yè)重估地圖
- 7 提雅智行搞出L4+自動(dòng)駕駛,讓全球車(chē)企睡不著覺(jué)?
- 8 汽車(chē)抬頭顯示的智能化旅程
- 9 飛行汽車(chē):開(kāi)啟規(guī);囷w
- 10 車(chē)規(guī)級(jí)、消費(fèi)級(jí)芯片,到底在爭(zhēng)什么?