GOGO人体无码一区二区,一本之道AV不卡精品

<ol id="bqsow"><source id="bqsow"></source></ol>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 機(jī)器學(xué)習(xí) > 正文

“反擊”馬斯克，奧特曼說OpenAI有“好得多”的自動駕駛技術(shù)

2025-07-07 13:44

賽博汽車

關(guān)注

作者 | 邱鍇俊

編輯 | 章漣漪

OpenAI的CEO山姆·奧特曼和特斯拉CEO馬斯克的矛盾，已經(jīng)是硅谷熱門的八卦。

兩人都是OpenAI的聯(lián)合創(chuàng)始人，但是奧特曼將OpenAI轉(zhuǎn)向商業(yè)化運營之后，馬斯克指責(zé)其背離初心，并起訴他違背創(chuàng)始協(xié)議。另外，馬斯克還成立xAI，和OpenAI直接競爭。

奧特曼也奮起反擊，公布郵件顯示，馬斯克試圖掌控OpenAI，遭到拒絕后才不斷阻撓。

奧特曼可能還醞釀了一個“以其之道還施彼身”的反擊舉措，那就是研發(fā)自動駕駛，和特斯拉FSD競爭。

最近，奧特曼在做客了自己兄弟杰克·奧特曼的脫口秀，不知是否和兄弟聊天說漏了嘴。

他說：

我想我們有一些新技術(shù)，可以為普通汽車提供自動駕駛，而且比當(dāng)前技術(shù)要好得多。

I think we have some new technology that could just do self-driving for standard cars way better than any current approach has worked.

這里說比“當(dāng)前技術(shù)”“好得多”，當(dāng)然也包括馬斯克的FSD。

不過，奧特曼并沒有詳細(xì)介紹這一技術(shù)和推進(jìn)的時間表。只是說：

如果我們的人工智能技術(shù)真能駕馭汽車，那還是很酷的。

If our AI techniques can like really go drive a car that's still pretty cool.

根據(jù)紐約時報旗下DealBook的消息，該技術(shù)尚處于早期階段，商業(yè)化也還要很遠(yuǎn)。

據(jù)其分析，這一技術(shù)涉及 OpenAI的Sora視頻軟件及其機(jī)器人團(tuán)隊，但OpenAI 發(fā)言人沒有置評。

此前，OpenAI并沒有直接探索自動駕駛業(yè)務(wù)，只是通過投資布局了一些自動駕駛、汽車智能化的公司。

當(dāng)然，作為AI應(yīng)用中最被看好的一個場景，自動駕駛擁有廣闊前景，也吸引了巨大關(guān)注。OpenAI如果真有絕招，是絕對不會放棄如此巨大的市場的。

如此看來，奧特曼和馬斯克以后大概率會吵得更兇。

01 什么絕招？

奧特曼上下嘴唇一碰，大家就要相信，OpenAI真有“好得多”的自動駕駛技術(shù)嗎？

畢竟當(dāng)前自動駕駛也是強(qiáng)手如林，谷歌旗下Waymo、特斯拉、Moblieye、高通、博世、還有一大批來自中國的企業(yè)，都已經(jīng)探索很久了。

OpenAI可能的技術(shù)路徑是什么呢？

大家可能都會回想起2024年初，OpenAI發(fā)布了Sora——文本生成視頻模型。

Sora生成的視頻

Sora可以根據(jù)用戶輸入的文本，快速制作長達(dá)一分鐘的高保真視頻，還能獲取現(xiàn)有的靜態(tài)圖像并從中生成視頻。

Sora生成的視頻一下子驚艷了世人，因為這一模型能夠理解復(fù)雜場景中不同元素之間的物理屬性及其關(guān)系，掌握物體在物理世界中的存在和運動方式，從而生成足以以假亂真的視頻。

幾乎在Sora一發(fā)布，自動駕駛、智能駕駛業(yè)界就討論說，可將Sora用于自動駕駛的模擬和訓(xùn)練，生成合成視頻數(shù)據(jù)，尤其是一些極限場景Corner Case，以彌補(bǔ)現(xiàn)實數(shù)據(jù)不足或成本高的問題。

然而，也有專業(yè)人士迅速指出，Sora生成的畫面，并不完全符合物理原理，也可能難以捕捉駕駛動態(tài)，如剎車或轉(zhuǎn)彎的物理行為。因此，并不能用來作為智駕模型訓(xùn)練的視頻數(shù)據(jù)。

不過，后來很多的研究者和從業(yè)者認(rèn)為，符合物理原理的仿真，還是能夠為數(shù)據(jù)訓(xùn)練提供數(shù)據(jù)的。或者，也可以用于強(qiáng)化訓(xùn)練模型。

近來，自動駕駛業(yè)界熱衷于搭建“世界模型”來作為自動駕駛模型的基座模型。而OpenAI一開始，就將Sora定義為可以生成視頻的世界模型。

像蔚來、小鵬等開發(fā)的世界模型，邏輯是讓AI系統(tǒng)創(chuàng)建心理上的世界地圖，以理解世界的運作方式，就像人類對世界的理解一樣，然后在此基礎(chǔ)上去駕駛車輛。

Sora的部分理念與世界模型模擬真實世界的目標(biāo)有一定的契合度。

另外，當(dāng)前自動駕駛開發(fā)的主流理念，都是“大數(shù)據(jù)-大模型-大算力”打法。OpenAI沒有駕駛數(shù)據(jù)，要想給出更好的自動駕駛技術(shù)，大算力沒問題，大模型也可以有，大數(shù)據(jù)則是無源之水——如果能靠仿真生成，至少邏輯上說得通。但不少專家認(rèn)為，依賴仿真數(shù)據(jù)存在巨大風(fēng)險。

02 OpenAI的汽車智能化業(yè)務(wù)

OpenAI自己沒搞過自動駕駛，也沒有過做過智能座艙，但是通過其投資，也有所設(shè)計。

2023 年OpenAI 向Ghost Autonomy投資500萬美元。這家自動駕駛公司還同時獲得了微軟的算力支持，也曾嘗試將AI語言模型應(yīng)用于自動駕駛。但是，它在2024年就倒閉了。

OpenAI-backed Ghost Autonomy shuts down | TechCrunch

Ghost Autonomy的自動駕駛車輛

2025年6月10日，OpenAI和汽車智能化公司Applied Intuition達(dá)成合作。雙方合作聚焦于把最新AI技術(shù)發(fā)展成果融入現(xiàn)代汽車，使其轉(zhuǎn)型為智能伙伴。

官方通告說，通過將大語言模型驅(qū)動的語音助手和智能體引入車內(nèi)，下一代汽車將成為具備深度個性化體驗的生產(chǎn)力工具。

通告還說，合作的核心目標(biāo)之一是實現(xiàn)移動設(shè)備與私人車輛智能系統(tǒng)的無縫連接。此外，Applied Intuition 還將在多個部門部署 ChatGPT，助力員工提升工作效率、優(yōu)化策略規(guī)劃，以更高效地實現(xiàn)公司目標(biāo)。

從這些描述來看，合作更偏向于智能座艙的人機(jī)交互方面，而不是直接應(yīng)用于自動駕駛。

03 從語言模型到多模態(tài)模型、世界模型

業(yè)界曾有觀點認(rèn)為，依托大語言模型的快速進(jìn)步，自動駕駛一類的空間智能可能很快實現(xiàn)。但是，如今的AI大牛們，都認(rèn)為，光靠語言模型，是不夠的。

OpenAI雖然以大語言模型震驚世人，仍以大型語言模型（LLM）為核心，但已逐步向多模態(tài)模型和世界模型領(lǐng)域延伸。

奧特曼也曾經(jīng)表示，世界模型需具備“理解物理因果關(guān)系、預(yù)測事件發(fā)展” 的能力，這與 LLM 的推理能力結(jié)合，可能推動AGI（通用人工智能）突破。

不僅僅是OpenAI這么判斷。包括人工智能教母李飛飛、Meta首席人工智能（AI）科學(xué)家Yann LeCun（楊立昆）都有類似觀點。

楊立昆就說，當(dāng)前AI雖在多個領(lǐng)域展現(xiàn)驚人能力，其仍缺乏理解物理世界、持久記憶、邏輯推理與分層規(guī)劃四大人類智能核心特征。

而沒有這些能力的AI，是不可能駕駛汽車的。

解決方案，眾人所指，都是世界模型。

楊立昆在Meta開源世界模型V-JEPA 2是說，在世界模型的幫助下，AI不再需要數(shù)百萬次的訓(xùn)練才能掌握一項新的能力，世界模型直接告訴了AI世界是怎樣運行的，這可以極大提升效率。

聽起來，有點奧特曼沒說出來的自動駕駛“大招”的影子。

實踐層面，AI時代“賣鏟子”的英偉達(dá)已經(jīng)遞上新“鏟子”。

在CES 2025上，英偉達(dá)CEO黃仁勛說，“機(jī)器人的 ChatGPT 時刻即將到來。與大語言模型類似，世界基礎(chǔ)模型（World Model）對推動機(jī)器人和自動駕駛汽車的開發(fā)至關(guān)重要。”

英偉達(dá)發(fā)布的Cosmos 世界基礎(chǔ)模型，就是專為物理交互、工業(yè)環(huán)境和駕駛環(huán)境的高質(zhì)量生成而構(gòu)建，具備生成逼真視頻、創(chuàng)建合成訓(xùn)練數(shù)據(jù)等能力，幫助機(jī)器人和汽車更好地理解物理世界。

NVIDIA 通過Cosmos 世界基礎(chǔ)模型強(qiáng)化面向自動駕駛的三個計算平臺| NVIDIA 英偉達(dá)博客