侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

Pix獨(dú)家丨理想汽車(chē)啟動(dòng)封閉開(kāi)發(fā),目標(biāo)率先突破下一代大模型 VLA

理想 i8 將在今年 7月發(fā)布,這之后的幾個(gè)月里,理想多款 i 系列純電車(chē)會(huì)密集上市。為了迎接它們,理想在準(zhǔn)備兩件事,一是大規(guī)模建設(shè) 5C 超充站,二是將智能駕駛的能力再提升一個(gè)高度。

文|曹琳

編輯|冒詩(shī)陽(yáng)

汽車(chē)像素(ID:autopix)原創(chuàng)

01.

理想急攻 VLA

我們獨(dú)家了解到,理想已在不久前啟動(dòng)了封閉式開(kāi)發(fā),目標(biāo)是到今年下半年,突破 VLA (視覺(jué)-語(yǔ)言-動(dòng)作)智駕大模型的落地難關(guān)。VLA 是今年智能駕駛的核心競(jìng)賽之一。目前理想汽車(chē)、吉利汽車(chē)和元戎啟行是 VLA 的主要推動(dòng)者,三家公司都希望成為率先落地 VLA 的一家。VLA 的落地有其難度。除了模型本身的研發(fā)需要時(shí)間,硬件的限制無(wú)法逾越。現(xiàn)在市面上可采購(gòu)到的芯片,性能基本都無(wú)法支持 VLA 的運(yùn)行。供應(yīng)商方案中,英偉達(dá)今年即將量產(chǎn)的 Thor 系列,有望能夠解決這一問(wèn)題。在理想汽車(chē)內(nèi)部,基于哪個(gè)芯片來(lái)開(kāi)發(fā)未來(lái)產(chǎn)品智駕方案的硬件算力平臺(tái),曾經(jīng)歷數(shù)輪變化。理想最先啟動(dòng)的方案是基于英偉達(dá) Thor-U 來(lái)開(kāi)發(fā),這也是元戎、吉利的方向,隨后調(diào)整為基于自研芯片做開(kāi)發(fā)。我們獨(dú)家了解到,去年底理想自研的芯片項(xiàng)目 “舒馬赫” 流片結(jié)果不及預(yù)期,在那之后,雖然自研芯片的項(xiàng)目重新上路,但理想暫停了基于自研芯片所做的算力平臺(tái)開(kāi)發(fā),轉(zhuǎn)而繼續(xù)用英偉達(dá)的 Thor-U MAX 做開(kāi)發(fā)。據(jù)時(shí)間線(xiàn)推斷,現(xiàn)在理想封閉開(kāi)發(fā)的 VLA 模型,大概率也是在英偉達(dá) Thor-U MAX 的基礎(chǔ)上做。智能駕駛每年都會(huì)有一輪新的技術(shù)競(jìng)賽,一次又一次改變第一梯隊(duì)的座次。2024 年的競(jìng)賽是端到端,理想的智能駕駛能力,也是在這一年中嶄露頭角。

去年 10 月底,理想汽車(chē)官宣全量推送端到端 +VLM 大模型,超過(guò) 30 萬(wàn)理想 AD MAX 版本車(chē)輛的車(chē)主,成為首批嘗鮮者。11 月 28 日,同樣基于端到端 +VLM,理想向 AD Max 版車(chē)主全量推送了車(chē)位到車(chē)位功能,成為行業(yè)首個(gè)全量推送這一功能的車(chē)企。從實(shí)際效果來(lái)看,理想的端到端 +VLM 方案的確受到了較高的評(píng)價(jià)。一位來(lái)自主要競(jìng)爭(zhēng)對(duì)手的智駕研發(fā)負(fù)責(zé)人告訴我們,理想全量推送后,該公司立刻找來(lái)了一輛測(cè)試車(chē),讓自家研發(fā)人員報(bào)名去體驗(yàn)。但這套方案只是階段性成果,端到端 +VLM 大模型并不能作為最終的解決方案。所謂端到端智駕大模型,是指用人工智能模型來(lái)取代舊智駕方案中的感知、規(guī)劃、控制三個(gè)模塊。智能駕駛系統(tǒng)不再依賴(lài)工程師編寫(xiě)的規(guī)則工作,而是訓(xùn)練 AI 模型,讓它學(xué)習(xí)人類(lèi)司機(jī)的開(kāi)車(chē)方式。這么做的好處是,智能駕駛的能力上限會(huì)更高,進(jìn)步速度會(huì)更快,駕駛方式更接近人類(lèi)。但現(xiàn)階段的大模型有其缺陷,比如決策不可解釋?zhuān)俦热缬猩倭侩y以預(yù)知的場(chǎng)景無(wú)法處理等。

為了解決種種問(wèn)題,理想在端到端模型的基礎(chǔ)上,增加了一個(gè) VLM(視覺(jué)語(yǔ)言)模型。端到端大模型是智能駕駛的專(zhuān)用模型,決策速度快,可以應(yīng)對(duì)絕大多數(shù)的駕駛問(wèn)題。VLM 是多模態(tài)模型,對(duì)圖像和場(chǎng)景的理解能力更強(qiáng)。現(xiàn)在主流的智能駕駛方案,逐步過(guò)渡到以攝像頭傳遞的圖像信息為主,因此 VLM 能夠提升整套智駕系統(tǒng)對(duì)復(fù)雜場(chǎng)景的理解能力,從而提升智能駕駛的精準(zhǔn)度。二者的組合可以理解為是,端到端大模型負(fù)責(zé)開(kāi)車(chē),VLM 提供意見(jiàn),為少量復(fù)雜場(chǎng)景兜底。這種組合雖然彌補(bǔ)了端到端大模型的不足,卻并不能作為智能駕駛的終極解決方案。

▍元戎啟行制作的圖解理想的端到端和 VLM,仍然是相對(duì)獨(dú)立的兩個(gè)模型。VLM 模型雖然理解能力強(qiáng),但推理速度慢,無(wú)法直接控制車(chē)輛,只能起到有限的作用。此外,VLM 模型通常需要本地部署,運(yùn)行起來(lái)大約需要占用整整一顆 Orin-X 芯片的算力。理想在去年二季度財(cái)報(bào)的電話(huà)會(huì)議上對(duì)外透露,公司內(nèi)部已經(jīng)啟動(dòng)了端到端 VLA 模型的研究。VLA 能夠?qū)⒋饲暗亩说蕉恕LM 兩個(gè)模型合二為一。也就是說(shuō),在新的模型中,多模態(tài)大模型不再作為輔助,而是內(nèi)化為了端到端智駕大模型的一種能力。

02.

智能駕駛接近決戰(zhàn)時(shí)刻

理想并不是智能駕駛領(lǐng)域的先行者,當(dāng)技術(shù)方向清晰后,理想迅速通過(guò)投入大算力和海量的數(shù)據(jù),快速驗(yàn)證路徑,追上了對(duì)手。這種路徑適用于車(chē)輛保有量大、且駕駛數(shù)據(jù)可有效回傳的車(chē)企。但隨著時(shí)間的推進(jìn),落后者的機(jī)會(huì)窗口逐漸縮窄。今年 2 月底,特斯拉 FSD V12 開(kāi)始在國(guó)內(nèi)小范圍測(cè)試,鯰魚(yú)來(lái)了。包括理想在內(nèi)的一些車(chē)企,將 VLA 視作是智能駕駛未來(lái)的方向,甚至可能是接近最終解決方案的一套技術(shù)路徑。今年 3 月 3 日,吉利汽車(chē)整合了旗下大部分智能駕駛方案,發(fā)布了統(tǒng)一的 “千里浩瀚”,由低到高分別推出 H1、H3、H5、H7 和 H9 五套智駕方案,在高階方案上率先落地 VLA,也是吉利的目標(biāo)。

此外,獲得了長(zhǎng)城汽車(chē)投資的智能駕駛方案商元戎啟行,也計(jì)劃在今年推出 VLA。然而,VLA 的落地一直有問(wèn)題沒(méi)有解決,需要研發(fā)人員深度交融兩個(gè)模型的數(shù)據(jù),這十分考驗(yàn)研發(fā)團(tuán)隊(duì)對(duì)AI大模型框架的定義能力。另一個(gè)限制在硬件,端到端與 VLM 融合后,車(chē)端模型參數(shù)會(huì)變得更大,同時(shí)新模型需要更高效的完成實(shí)時(shí)推理,理解復(fù)雜世界并給出建議,這些都對(duì)車(chē)端芯片有更高的要求,F(xiàn)在多數(shù)車(chē)企高階智駕的硬件方案,基本都是兩顆 Orin-X 芯片,算力 508Tops,不足以支持 VLA。英偉達(dá)最新一代車(chē)載 AI 芯片 Thor 單片 AI 算力最高是 1000Tops,且性能上對(duì)大模型的有更好的支持。包括理想 i8、極氪 EX1E、領(lǐng)克 900 等在內(nèi),很多很多車(chē)企旗艦車(chē)的上市時(shí)間集中在了今年下半年。VLA 并不是今年智駕唯一的賽場(chǎng),另一個(gè)技術(shù)路線(xiàn)的代表是華為、小鵬,去年他們同樣完成了端到端智駕方案的推送,時(shí)間點(diǎn)早于理想。

與理想的方案不同,華為、小鵬去年解決端到端大模型問(wèn)題的方式,可以描述為 “分段”。以小鵬為例,其智駕模型由神經(jīng)網(wǎng)絡(luò)感知網(wǎng)絡(luò) XNet、規(guī)控大模型 XPlanner 和大語(yǔ)言模型 XBrain 三個(gè)部分組成,增加了大模型的可解釋性和推理能力。華為、小鵬這條路徑上的競(jìng)賽,是推進(jìn)一段式端到端方案的研發(fā)。無(wú)論哪一個(gè)賽場(chǎng),頭部玩家智駕技術(shù)水平的快速迭代,都會(huì)導(dǎo)致競(jìng)賽的節(jié)奏變快,落后的玩家只能面對(duì)越來(lái)越高的門(mén)檻,后發(fā)制人的可能性會(huì)逐漸變小。

本文為汽車(chē)像素(autopix)原創(chuàng)內(nèi)容

未經(jīng)授權(quán),請(qǐng)勿轉(zhuǎn)載

       原文標(biāo)題 : Pix獨(dú)家丨理想汽車(chē)啟動(dòng)封閉開(kāi)發(fā),目標(biāo)率先突破下一代大模型 VLA

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀(guān)點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)