特斯拉車首次自己交付自己,是由哪些技術支撐的?
2025年6月28日,第一輛完全自動駕駛的特斯拉Model Y自己從工廠開到客戶家完成交付,比原計劃提前了一天!整個過程包括高速公路行駛在內(nèi)的跨城鎮(zhèn)運輸,全程實現(xiàn)無人駕駛(沒有遠程安全員)!
圖源自:特斯拉Tesla視頻號
“車內(nèi)完全沒有人,且在任何時候都沒有遠程操作員進行控制。”從某種意義上說,特斯拉的完全自動駕駛(FSD)和機器人出租車項目也能夠做到這一點,只是特斯拉沒有信心它們能夠長時間足夠可靠地運行,從而無需人工監(jiān)管。 而這一次model Y的自主交付,穿越整個城市,最高時速達到116 km/h,總路程約 24 公里(30 minutes,可見全程還是低速為主),成功抵達車主家中,整個過程無需任何人類干預。這一事件標志著自動駕駛技術的重大突破。
HW5.0硬件平臺:構建自動駕駛的感知與運算基石
特斯拉此次無人駕駛交付的成功,離不開其最新的HW5.0 硬件平臺的強力支撐。該平臺在傳感器配置和計算能力上都實現(xiàn)了跨越式升級。
在傳感器方面,特斯拉構建了一套精密且全面的感知系統(tǒng)。12顆高清攝像頭覆蓋車輛 360 度視角,探測距離可達 250 米,能夠精準捕捉道路上的各種細節(jié),包括遠處的交通標志、周圍車輛的行駛狀態(tài)以及行人的動作。為應對復雜天氣狀況,這些攝像頭采用了三星定制的 “耐候鏡頭”,內(nèi)置加熱元件可以在一分鐘內(nèi)快速融化冰雪,疏水涂層則能有效提升在雨天或霧天的透光率,確保攝像頭始終保持清晰的視野。此外,4 顆 4D 毫米波雷達和超聲波傳感器與攝像頭相互配合,形成了多傳感器融合的感知矩陣。毫米波雷達不受光線和天氣影響,能夠實時探測車輛周圍物體的距離、速度和角度,超聲波傳感器則在近距離感知和泊車場景中發(fā)揮重要作用。
計算能力上,HW5.0平臺配備了 Dojo 超級計算機,其算力達到了1.1 EFLOPS,是前代產(chǎn)品的 5 倍之多。如此強大的算力,使得系統(tǒng)能夠每秒處理 250 億像素的數(shù)據(jù),為復雜的神經(jīng)網(wǎng)絡運算提供了堅實保障。無論是 4D 環(huán)境建模,還是實時路徑規(guī)劃,都能快速且準確地完成,確保車輛在行駛過程中做出及時、合理的決策。同時,平臺采用的冗余設計也極大提升了系統(tǒng)的可靠性,雙獨立計算單元具備 0.3 毫秒自動切換能力,即使其中一個單元出現(xiàn)故障,另一個單元也能迅速接管,保證車輛行駛的安全性和穩(wěn)定性。
EFLOPS是浮點算力單位,適用于需要高精度計算的場景(如科學模擬、AI訓練)。
TOPS是操作次數(shù)單位,側重低精度整數(shù)運算,常見于邊緣設備(如自動駕駛芯片、手機NPU)。
如果硬要換算一下,1 EFLOPS = 10^6 TOPS,但實際轉換需考慮精度差異:若硬件支持混合精度(如FP16+INT8),這個換算僅是理論峰值,而且實際效率還受內(nèi)存帶寬限制。
還需要說明的是Dojo是一個計算系統(tǒng)架構,也被稱為超級計算機架構,可以組合擴展的(所謂scalable),它的核心芯片是D1。在特斯拉引領的自動駕駛技術變革浪潮中,Dojo 扮演著舉足輕重的角色,它不僅是特斯拉 AI 戰(zhàn)略的核心驅動力,更是其在硬件層面實現(xiàn)突破的關鍵標志。但嚴格來說,Dojo 一個集計算、網(wǎng)絡、輸入 / 輸出(I/O)芯片,指令集架構(ISA)、電源傳輸、封裝和冷卻于一體的超級計算架構。它專為大規(guī)模運行定制的機器學習訓練算法而設計,致力于為特斯拉的自動駕駛技術以及其他 AI 應用提供前所未有的強大算力支持 。
圖 Dojo的堆疊式組合架構,可以組合擴展
Dojo架構的核心組件之一是 D1 芯片。這顆由特斯拉自主研發(fā)、基于臺積電 7 納米工藝打造的芯片,集成了多達 500 億個晶體管 。每顆 D1 芯片內(nèi)包含 354 個定制的 64 位 RISC-V 內(nèi)核,每個內(nèi)核配備 1.25MB 的 SRAM,用于存儲數(shù)據(jù)和指令,這使得 D1 芯片在處理 AI 相關運算時具備高效的數(shù)據(jù)讀取與存儲能力。從性能參數(shù)上看,在 400W 的 TDP(熱設計功耗)下,單個 D1 芯片能夠實現(xiàn) 22.6 TFLOPS 的 FP32(單精度浮點運算)性能 。
圖 D1芯片,Dojo的基本tile(瓦片)
為了進一步提升算力,特斯拉采用獨特的設計方式,將25 顆 D1 芯片以 5×5 的集群形式進行組織,運用臺積電的晶圓上系統(tǒng)技術(InFO_SoW)進行封裝。這種封裝技術實現(xiàn)了芯片間極低的延遲和極高的帶寬,使得大量的計算得以高效集成。由 25 顆 D1 芯片組成的一個訓練模組,在 15 千瓦的液冷封裝下,能夠達到 556TFLOPS 的 FP32 性能,且每個模組配備 11GB 的 SRAM,并通過 9TB/s 的結構連接 。
Dojo超級計算架構通過將多個這樣的訓練模組進一步組合,構建出更龐大的計算集群。例如,120 個訓練模組組成一組 ExaPOD 計算集群,其中共計包含 3000 顆 D1 芯片,展現(xiàn)出驚人的算力規(guī)模。在實際應用中,這種強大的算力讓 Dojo 能夠對海量的視頻數(shù)據(jù)進行高效處理,如每天處理 23.2 萬幀視頻,助力特斯拉不斷優(yōu)化神經(jīng)網(wǎng)絡模型,提升交通燈識別、自動泊車等功能的準確性和穩(wěn)定性 。
而作為Dojo元件的D1芯片本身也表現(xiàn)不俗。
圖 D1芯片和主流自動駕駛芯片的性能對比,光是功率都達到400w,是Orin的數(shù)倍
軟件架構:從代碼(規(guī)則)到神經(jīng)網(wǎng)絡的智能化跨越
特斯拉的FSD V12 軟件架構代表了自動駕駛技術的一次革命性突破。傳統(tǒng)的自動駕駛系統(tǒng)依賴大量的 C++ 代碼來實現(xiàn)各種功能,但 FSD V12 大膽采用了端到端的神經(jīng)網(wǎng)絡技術,直接將視覺輸入映射為車輛的控制輸出,模擬人類駕駛員的決策過程。
端到端學習模式摒棄了過去繁瑣的代碼邏輯,通過對海量駕駛數(shù)據(jù)的學習,神經(jīng)網(wǎng)絡能夠自動識別道路場景中的關鍵信息,并做出相應的駕駛決策。例如,在面對前方100 米處可能出現(xiàn)行人橫穿馬路的情況時,系統(tǒng)能夠根據(jù)歷史數(shù)據(jù)和當前場景特征,預測行人的行動概率,并提前調(diào)整車速,以確保行車安全。這種學習方式不僅提高了系統(tǒng)的適應性,還能更好地應對各種復雜的、非標準的道路場景。
HydraNet + Transformer架構是 FSD V12 的另一大核心技術。HydraNet 多任務學習網(wǎng)絡實現(xiàn)了不同任務之間的特征共享,比如在進行物體檢測和車道識別時,能夠避免重復計算,提高運算效率。而 Transformer 的注意力機制則為系統(tǒng)賦予了強大的環(huán)境理解能力,它構建的 4D 向量空間(3D 空間 + 時間)可以有效處理遮擋和動態(tài)障礙物。當車輛行駛在交通繁忙的路段,面對前方車輛遮擋視線的情況時,系統(tǒng)能夠通過對周圍環(huán)境的歷史數(shù)據(jù)和當前狀態(tài)進行分析,預測被遮擋區(qū)域可能出現(xiàn)的障礙物,并提前規(guī)劃避讓路線。
占用網(wǎng)絡(Occupancy Network)一直用于增強系統(tǒng)對復雜環(huán)境的感知能力。該網(wǎng)絡將車輛周圍環(huán)境劃分為體素,能夠識別各種不規(guī)則障礙物,如側翻的車輛、掉落的貨物等,并預測它們的運動趨勢。這使得特斯拉的自動駕駛系統(tǒng)在面對未標記道路、施工區(qū)域等特殊場景時,也能從容應對,大大提升了行駛的安全性和可靠性。
圖 Tesla FSD V12架構圖,“99%都是神經(jīng)網(wǎng)絡”
數(shù)據(jù)與訓練:海量數(shù)據(jù)驅動的智能進化
數(shù)據(jù)是自動駕駛技術發(fā)展的核心驅動力,特斯拉在這方面擁有巨大的優(yōu)勢。其全球車隊積累了超過120 億英里的真實駕駛數(shù)據(jù),這些數(shù)據(jù)涵蓋了各種道路條件、天氣狀況和駕駛場景,為算法的訓練提供了豐富的素材。同時,特斯拉還通過仿真平臺生成大量的合成數(shù)據(jù),模擬現(xiàn)實中難以遇到的極端場景,如突發(fā)的自然災害、罕見的交通事故現(xiàn)場等,進一步擴充訓練數(shù)據(jù)的多樣性,幫助系統(tǒng)更好地應對各種邊緣情況。
Dojo超級計算機在數(shù)據(jù)處理和模型訓練中發(fā)揮著關鍵作用。憑借 88.5 EFLOPS 的總算力(單個Dojo訓練模塊(含3000顆D1芯片)算力為1.1 EFLOPS(每秒1.1×10^18次浮點運算),Dojo超級計算機是多個訓練模塊組成,可以參見https://www.slashgear.com/1516714/what-to-know-about-tesla-dojo-supercomputer/),Dojo 能夠對海量的視頻數(shù)據(jù)進行高效處理。例如,它可以每天處理 23.2 萬幀視頻,通過對這些視頻的分析和學習,不斷優(yōu)化神經(jīng)網(wǎng)絡模型,提升交通燈識別、自動泊車等功能的準確性和穩(wěn)定性。
影子模式(Shadow Mode)是特斯拉持續(xù)優(yōu)化自動駕駛系統(tǒng)的重要手段。在實際道路行駛中,該模式會持續(xù)對比自動駕駛系統(tǒng)的決策與人類駕駛員的操作,收集兩者之間的差異數(shù)據(jù)。這些數(shù)據(jù)被反饋到訓練模型中,用于進一步改進算法,降低系統(tǒng)在實際應用中的干預率。目前,特斯拉的城市道路自動駕駛干預率已降至每千公里1.2 次,這一成績充分體現(xiàn)了數(shù)據(jù)驅動的優(yōu)化策略的有效性。
極端環(huán)境適應:應對復雜場景的技術底氣
自動駕駛技術在實際應用中面臨著各種復雜的環(huán)境挑戰(zhàn),特斯拉通過硬件和軟件的協(xié)同優(yōu)化,提升了系統(tǒng)在極端環(huán)境下的適應能力。
在天氣應對方面,硬件上的耐候設計和軟件算法的優(yōu)化缺一不可。耐候鏡頭和加熱元件解決了冰雪天氣下攝像頭視野模糊的問題,而HDR 成像和去霧算法則在軟件層面增強了系統(tǒng)在低能見度條件下的感知能力。在暴雨測試中,F(xiàn)SD V12 的避障準確率較前代版本提升了 30%,這得益于算法對雨水干擾的有效過濾和對道路信息的精準提取。
光照條件同樣會影響自動駕駛系統(tǒng)的性能。特斯拉采用的自適應曝光調(diào)節(jié)和偏振濾鏡技術,能夠有效減少強光眩光的干擾,使交通燈識別準確率提升40%。無論是在陽光強烈的正午,還是在光線昏暗的傍晚,系統(tǒng)都能清晰地識別道路標志和交通信號,確保車輛安全行駛。
對于復雜地形,特斯拉也進行了針對性的算法優(yōu)化。在舊金山等擁有大量陡坡和急轉彎的城市,F(xiàn)SD V12針對這類特殊地形進行了專門的訓練和參數(shù)調(diào)整,使其在處理陡坡起步、急轉彎等場景時更加得心應手,急轉彎成功率較 V11 版本提升了 37%。
冗余:保證AI安全的基本技術
安全始終是自動駕駛技術的重心,特斯拉通過多重安全與冗余設計,為無人駕駛交付提供了可靠的保障。
硬件層面,雙計算單元、三冗余傳感器融合以及獨立電源構成了堅固的安全屏障。即使其中一個計算單元出現(xiàn)故障,另一個單元也能無縫接管,確保系統(tǒng)的正常運行;三冗余傳感器融合(攝像頭+ 雷達 + 慣性測量單元)則保證了在某個傳感器失效的情況下,其他傳感器仍能提供準確的環(huán)境感知信息。在軟件方面,傳統(tǒng)控制算法與神經(jīng)網(wǎng)絡相互交叉驗證決策,當神經(jīng)網(wǎng)絡出現(xiàn)異常時,傳統(tǒng)算法可以及時介入,避免事故發(fā)生。在緊急制動場景下,系統(tǒng)能夠實現(xiàn) 0.8g 的減速度,并且避障成功率高達 95%。
此外,特斯拉還建立了實時監(jiān)控機制,AI系統(tǒng)持續(xù)監(jiān)測傳感器和計算單元的運行狀態(tài),一旦檢測到異常,能夠在 50 微秒內(nèi)觸發(fā)警報或使系統(tǒng)進入安全模式,最大限度地保障車輛和乘客的安全。
總結
當然,這次model Y的自主交付是在美國完成的,在國內(nèi)表現(xiàn)可能沒這么好,因為國內(nèi)的訓練數(shù)據(jù)是禁止流入境外的,特斯拉引以為傲的120億英里的真實駕駛數(shù)據(jù),并沒有多少是中國國內(nèi)的。
比如擬在2026年1月1日生效的最新的國標,《汽車整車信息安全技術要求》GB44495—2024,
圖 GB44495—2024計劃在2026年1月1日生效
就明確有如下測試條目。
圖 防數(shù)據(jù)出境測試方法
眾所周知,AI的基礎是大數(shù)據(jù),AI模型都是大數(shù)據(jù)喂出來的。所以此次drive itself to owner還只能當做個例來看。何時能夠普及到國內(nèi)用戶,拭目以待。
-- END --
原文標題 : 特斯拉車首次自己交付自己,是由哪些技術支撐的?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字