訂閱
糾錯
加入自媒體

OpenAI進行TPU測試:AI芯片市場格局正在變化

2025-07-09 13:50
芝能智芯
關注

芝能智芯出品

圍繞谷歌TPU與OpenAI之間的關系,AI算力資源配置、供應商格局及市場走向的微妙博弈正在展開。

盡管媒體曾傳出OpenAI將大規(guī)模采用谷歌TPU取代英偉達GPU的消息,但事實并非如此。OpenAI只是小規(guī)模測試,并未形成大規(guī)模轉(zhuǎn)移的趨勢。

在芯片性能、供應協(xié)議、基礎設施兼容性及部署成本的多重因素牽引下,OpenAI仍堅定維持英偉達和AMD為主的技術路徑。

谷歌TPU在云服務層面逐漸開放,但距離真正撼動現(xiàn)有算力格局仍有障礙。

Part 1TPU測試的局部探索與AI基礎設施選擇的慣性

關于OpenAI是否將在模型訓練與推理中轉(zhuǎn)向谷歌TPU,市場有過激烈猜測,但實際進展遠沒有那么迅猛。

OpenAI明確表示,雖然在內(nèi)部對TPU進行測試,但并無大規(guī)模部署計劃,未來算力支撐仍以英偉達GPU與少量AMD加速器為主。

現(xiàn)階段,TPU僅在特定任務或試驗場景中被使用,其實質(zhì)影響有限。這種謹慎態(tài)度背后,是對硬件生態(tài)、部署效率和平臺遷移成本的深刻權衡。

OpenAI的大模型訓練任務以極高的并行度和穩(wěn)定性為要求,已深度集成在CUDA、NCCL等英偉達生態(tài)下,切換至TPU不僅意味著代碼層重構,還涉及部署工具鏈和數(shù)據(jù)流管理邏輯的根本變更。

再加上與英偉達長期的供應協(xié)議保障了芯片優(yōu)先交付,對OpenAI而言,貿(mào)然切換硬件平臺可能得不償失。

從現(xiàn)階段情況來看,OpenAI雖然在谷歌云上采購了一定的TPU服務,但使用的多是相對基礎版本。

谷歌用于自家Gemini大模型的最新一代TPU并未對OpenAI開放,TPU仍未脫離“自研自用”的影子,谷歌雖試圖推動其商業(yè)化,但高性能算力資源的調(diào)配仍然偏向內(nèi)部優(yōu)先。

在AI芯片部署策略上,OpenAI采取多元試探、以主帶輔的方式,反映出當前大型AI企業(yè)對異構計算資源的結構性依賴及對平臺穩(wěn)定性的重視。

盡管TPU在某些矩陣計算任務上具有效率優(yōu)勢,但OpenAI不愿放棄其在GPU平臺上多年積累的優(yōu)化成果和系統(tǒng)穩(wěn)定性。

Part 2谷歌TPU的“出圈”嘗試與生態(tài)突破的挑戰(zhàn)

谷歌TPU的誕生源于對自家AI服務日益增長的算力需求,設計上聚焦神經(jīng)網(wǎng)絡的訓練與推理,采用數(shù)據(jù)流架構和矩陣乘法加速單元,以應對大模型帶來的計算挑戰(zhàn)。

長期以來,TPU主要服務于谷歌內(nèi)部應用,如Gemini、搜索、地圖與相冊等,為數(shù)十億用戶提供支撐。

直到近期,谷歌才正式將TPU商業(yè)化,向外部客戶開放,意圖打造更具競爭力的AI基礎設施平臺。

在英偉達GPU全球短缺、訓練成本高企的背景下,TPU商業(yè)化不僅有望帶來新增營收,也被視為谷歌削弱英偉達壟斷地位的關鍵一步。

但挑戰(zhàn)不容忽視。TPU目前原生支持TensorFlow與JAX,并逐步兼容PyTorch,然而在后者主導的大模型生態(tài)中,GPU早已形成完整的工具鏈與開發(fā)習慣。

從模型微調(diào)到并行編排,再到部署優(yōu)化,GPU生態(tài)具備高度成熟度。對于已深度綁定GPU的公司(如OpenAI、Anthropic、Meta等),轉(zhuǎn)向TPU意味著整體訓練架構、工具體系甚至底層邏輯的重構,遷移成本高,周期長,存在上線節(jié)奏受擾風險。

TPU的部署策略仍顯保守。目前在北美、歐洲及亞洲部分區(qū)域開放了v5p、v5e與Trillium等版本,但在全球資源覆蓋、彈性調(diào)度能力、隔離保障等方面尚難與英偉達的體系匹敵。

同時,TPU平臺在開放程度上仍有限,例如支撐Gemini的Trillium尚未全面外放,進一步限制了其在超大模型訓練市場的滲透。

盡管已有部分客戶(如蘋果、Anthropic)開始試用TPU,但多基于資源冗余或特定任務考量,尚未形成穩(wěn)定的替代趨勢。

作為AI芯片領域的后來者,TPU雖具技術優(yōu)勢,但要完成從內(nèi)部算力工具到通用云平臺的躍遷,仍需解決生態(tài)適配、用戶心智切換與工具鏈完備性等關鍵問題。

盡管其開放力度在增強,但在如OpenAI等核心客戶中尚未建立持續(xù)影響力。

在短期內(nèi),AI計算架構仍將以GPU為主,TPU與其他加速器為輔,除非出現(xiàn)支持跨平臺、標準化開發(fā)的新一代開源工具與部署框架,市場格局才有可能被真正撼動。

當前TPU在產(chǎn)業(yè)中的角色更接近于高性能補充,而非主導變革者。若谷歌希望TPU實現(xiàn)規(guī);粐,不僅需在性能上持續(xù)突破,更應在生態(tài)聯(lián)通、開發(fā)體驗與平臺開放性上對標英偉達。

AI芯片之爭,遠未見終局,而TPU的真正戰(zhàn)斗,也才剛剛開始。

小結

從OpenAI試用TPU但并未大規(guī)模采用的表態(tài)可以看出,在超大規(guī)模AI公司中,芯片合作伙伴的選擇并非僅由性能決定,更受制于部署慣性、生態(tài)整合度及供應關系的粘性。

OpenAI仍將英偉達作為核心依賴,部分采用AMD作為補充,并開始嘗試自研芯片,為未來可能的算力擴張與降本做準備。

       原文標題 : OpenAI進行TPU測試:AI芯片市場格局正在變化

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號