訂閱
糾錯
加入自媒體

百度智能云,造出了AI時代的擎天柱

2025-08-29 14:08
腦極體
關注

圖片

最近,AI領域關于AI Infra,即人工智能基礎設施的討論越來越熱烈。DeepSeek V3.1發(fā)布后,一則適配下一代國產(chǎn)芯片的官方留言讓寒武紀的市值預估全面上調。百度的昆侖芯中標了中國移動集采項目的十億級訂單。從產(chǎn)業(yè)界到投資界,可以說全面提升了對AI基礎軟硬件的整體期待。

這種變化的內在原因是什么?為什么AI Infra開始成為AI產(chǎn)業(yè)熱切追逐的新關鍵詞?如何才能實現(xiàn)符合產(chǎn)業(yè)期待的AI Infra?

想要探討這個問題時,我想到了一個有趣的名字:《變形金剛》里的擎天柱。1984年,上海電影譯制廠在引進這部經(jīng)典動畫片的時候,將其中主角汽車人領袖Optimus Prime的中文譯名定為“擎天柱”。相比于港臺版的“柯博文”和“無敵鐵牛”,取自《淮南子》中共工氏怒觸不周山故事的“擎天柱”可謂兼具信達雅。這個名字展現(xiàn)出了主角強悍勇猛的外表與戰(zhàn)斗力,同時表達出了其能夠支撐一切,堅實可靠的精神內核。

在AI時代,我們總是希望讓智能化技術打破天花板,探索到人類此前無法觸及的未知領域。但想要實現(xiàn)這個目標,首先需要有堅實的基礎設施,能夠支撐AI模型觸達天際。

圖片

8月28日,2025百度云智大會在北京舉辦。期間全面升級的百舸5.0,或許就是這樣一座AI擎天柱。

圖片

一般意義上來說,AI Infra指用來部署、運行、管理和優(yōu)化AI模型的軟硬件體系,其中包括我們熟悉的AI算力、AI推理引擎,以及一系列模型開發(fā)與調用工具等。AI infra可以說自AI技術誕生之日起就存在,但為什么近期才引發(fā)廣泛關注?

這其中的核心因素在于,在大模型發(fā)展的初始階段,各界對AI infra需求是只要能夠支撐大模型訓練推理就可以,關于產(chǎn)業(yè)創(chuàng)新力與競爭力的聚焦重點更多集中在模型本身。但隨著大模型與各個產(chǎn)業(yè)場景的融合,以及模型調用體量的規(guī);,大家逐漸發(fā)現(xiàn)基礎設施并不僅僅意味著能訓練、能推理,而是可以基于基礎設施,為模型創(chuàng)造新價值,強化模型本身的訓推效率與用戶體驗。如果說,過去行業(yè)對AI Infra的要求是能夠跑起來模型,那現(xiàn)在的目標則轉為依靠AI Infra贏得未來。

圖片

舉個例子,今天我們可以在各個平臺應用到DeepSeek,但是不同平臺間的體驗效果卻有著明顯的差異。有些平臺很容易陷入卡頓,有些平臺會有普遍過高的推理時長。稍加比對之后,用戶就會自然傾向選擇那些更流暢、快捷的平臺來使用大模型。這就是AI Infra差異給企業(yè)帶來的競爭力差距。

而在諸多AI Infra的相關能力中,AI算力毫無疑問是最關鍵的一種。良好的AI算力供給已經(jīng)不只是模型推訓的基礎支撐,更是模型效果與商業(yè)前景的決定性因素。

一般來說,算力向的AI Infra平臺在三方面決定了模型的上限:帶來低延遲、高效率的模型訪問體驗,讓AI推理絲滑流暢;實現(xiàn)強大的模型穩(wěn)定性,確保服務不中斷,不降級;提高資源利用率,讓更少的硬件處理更多請求,從而降低整體性AI成本。

所謂AI Infra不牢,大模型地動山搖。AI infra已經(jīng)不再是千篇一律的共性條件,而是其本身就能成為AI競爭力的核心來源。想要讓模型突破想象力的天際,首先需要架起AI infra的擎天柱。

全新升級的百舸,目標就是定義擎天柱一般牢固可靠的基礎設施。

圖片

AI算力基礎設施的效果來自多個層面,比如網(wǎng)絡、計算、推理等。而百舸新升級的亮點之處就在于,它不是從某個方面提升AI算力的獲取效果,而是帶來一場近乎全方位的實力增長。也就是說,百舸正在從全維度上定義什么是AI算力的擎天柱。

百度智能云最新發(fā)布的百舸AI計算平臺5.0,在網(wǎng)絡、計算、推理系統(tǒng),以及訓推體效率上進行了全面升級,實現(xiàn)了強化學習效率領先的跨越式迭代,從而全面打破了AI計算的效率瓶頸。

所謂鼎有三足,三角形具有穩(wěn)定性。具體來看,百舸5.0的支柱作用,就是由極其穩(wěn)固的三大支點構筑而成的:

圖片

1.網(wǎng)絡支柱。

百舸5.0對大模型計算多涉及的VPC、RDMA和X-Link網(wǎng)絡都進行了全面升級。其中高速VPC網(wǎng)絡可以支持200Gbps(GigaBytes)的巨型幀傳輸,從而顯著提升模型的訓推效率。百舸自研HPN網(wǎng)絡可以支持單集群10萬卡RDMA網(wǎng)絡互聯(lián),并將端到端延遲壓縮至4us。面對超大參數(shù)規(guī)模的MoE模型,百舸打造了百度自研的X-Link協(xié)議,實現(xiàn)了更快速度的專家間通信。從而為MoE模型帶來更好的推訓效果。

2.計算支柱。

面對超大模型對大規(guī)模AI計算集群的必然需求,百舸也進行了超節(jié)點的全新探索。最新發(fā)布的昆侖芯超節(jié)點,采用了深受國家重點行業(yè)認可,百度全棧自研的昆侖芯,通過將64張卡組成超節(jié)點,昆侖芯超節(jié)點實現(xiàn)了單卡性能提升95%,單實例推理能力提升8 倍。而公有云是企業(yè)獲取大規(guī)模AI算力的最佳途徑;诎亵,用戶可以輕松在幾分鐘時間內,利用1個云實例,就允許萬億參數(shù)的大模型;诎俣戎悄茉茝姶蟮募夹g能力,昆侖芯超節(jié)點在各項能力上都實現(xiàn)了業(yè)界最佳,從而讓百舸在AI Infra上成為國內天花板級別的存在,真正做到了力可擎天。

圖片

3.推理支柱。

伴隨著大模型成為越來越多用戶的日常剛需,模型推理能力的提升進入了非常關鍵的攀升階段。為此,百舸5.0全新升級了推理系統(tǒng),通過“解耦”“自適應”和“智能調度” 三大核心策略,對AI推理的算力、內存、網(wǎng)絡等資源進行極致精細化的管理和優(yōu)化,從而實現(xiàn)性能的數(shù)量級提升,最終實現(xiàn)MoE推理吞吐模型提升超過50%,TTFT低至0.5秒。

回到上文討論過的DeepSeek推理部署場景,在全新升級的百舸中,DeepSeek R1的推理吞吐可以提升50%,從而讓百舸用戶可以有效獲得遠超同類平臺的模型體驗與資源利用效率。

圖片

與此同時,百舸發(fā)布的強化學習框架可以實現(xiàn)極致壓榨算力資源,提升訓練、推理效率的全面迭代?蚣懿辉侔延柧毢屯评懋斪鲀蓚獨立的流程,而是將其實現(xiàn)像工業(yè)流水線一般的高度協(xié)同、無縫銜接。這種工作模式可以最大化提升資源利用效率,將成為主流的強化學習模型整體效率提升到行業(yè)新高度。目前,其已經(jīng)支撐了百度在金融、教育、編程、客服等垂直領域的強化學習模型訓練,接下來將成為產(chǎn)業(yè)各界擁抱強化學習模型的關鍵契機。

這三大支柱的加持,讓百舸5.0能夠將模型的計算效率提升至極致。也只有如此,模型才能進一步打破極限,自由探索廣闊無際的智能奧義。

想讓模型捅破天,就要讓AI Infra變成擎天柱——這就是百舸5.0的定義的基礎設施強度。

圖片

《變形金剛》里,擎天柱最常說的一句臺詞是“汽車人,變形出發(fā)”。在現(xiàn)實世界,百舸5.0的臺詞則應該是:企業(yè)智能化,基于AI Infra變形出發(fā)。

我們可以通過兩個故事,來看看那些最受關注的行業(yè)和領域,如何通過百舸打破產(chǎn)業(yè)局限,實現(xiàn)將基礎設施化為AI生產(chǎn)力的目標。

故事一,“機器人變形”。

具身智能是目前國內炙手可熱的科技發(fā)展與創(chuàng)業(yè)、投資風口。而百度智能云則已經(jīng)支持了包括北京、上海、浙江、廣東創(chuàng)新中在內的具身智能“國家隊”,也在為產(chǎn)業(yè)鏈上超過20家重點企業(yè)提供算力支持。

圖片

百度智能云之所以能夠獲得青睞,是因為具身智能處在行業(yè)發(fā)展初期,急需要強大的算力支撐,并且盡可能提高模型的開發(fā)效率。百舸在算力高效調度、模型訓推加速等方面的產(chǎn)品技術積累,可以大幅提升了具身智能模型的開發(fā)效率。在具身智能的高速發(fā)展階段,百舸提供了極其關鍵的效率與資源利用率支持,讓機器人更好、更快地向著實用化、可落地的方向“變形”。

故事二,“創(chuàng)作者出發(fā)”。

Vast是一家專注于通用模型研發(fā)的AI公司,致力于通過打造大眾級3D內容創(chuàng)作工具建立3D UGC內容平臺。主要產(chǎn)品是面向游戲、CG影視、動畫、建筑室內、XR/VR、數(shù)字孿生等行業(yè)提供的3D大模型。借助Vast方案,用戶僅需上傳圖片1分鐘內便可生成空間3D資產(chǎn),是這一領域冉冉升起的新星企業(yè)。

在業(yè)務發(fā)展過程中,Vast發(fā)現(xiàn)需要面臨冗長的模型訓練周期與高昂的算力成本,并且從數(shù)據(jù)籌備到模型訓推,每一步都必須精準無誤,對團隊技術能力考驗極高。通過使用百舸平臺,Vast獲得了專為大模型打造的高性能云原生AI計算支持。其中包含全面的集群運維支持和任務全生命周期管理,同時具備訓練/推理加速、故障容錯、智能故障診斷等高級功能。通過強大的AI基礎設施與成熟的AI工程化能力,百舸有效降低了Vast的大模型訓練時間,節(jié)約了資源成本,并且極大降低了模型訓推的綜合門檻。最終實現(xiàn)了Vast可以更快、更好地開發(fā)出新一代3D大模型,最終讓設計師與內容創(chuàng)作者獲得高效探索AI可能性的方案。

百舸對智能化業(yè)務的深度理解和有效支撐,深深根植于百度智能云在AI云領域的積累。根據(jù)8月18日IDC發(fā)布的《中國AI公有云服務市場份額,2024:全面向生成式AI演進》顯示,2024年中國AI公有云服務市場規(guī)模達195.9億元,百度智能云以24.6%的市場份額穩(wěn)居第一,連續(xù)六年、累計十次蟬聯(lián)中國AI公有云市場冠軍,充分體現(xiàn)了百度智能云率先提出“云智一體”戰(zhàn)略的前瞻性與落地成果。深度理解AI業(yè)務,并能提供強有力的AI算力支撐,事實上在公有云市場當中是一種十分稀缺的能力。而這也在成為百度智能云堅固的護城河。

圖片

在百度智能云的體系中扮演算力底座的百舸,正在加速成長和壯大。從以上這些故事中不難看出,百舸5.0作為擎天柱,托舉著企業(yè)打破AI時代的天花板。在降低訓練時長、節(jié)約資源開支、提升模型體驗、降低模型開發(fā)難度等方面實現(xiàn)了全方位的AI infra升級。

在它的幫助下,企業(yè)可以更簡單快捷地出發(fā),去探索,去創(chuàng)造,去將未知收入囊中。AI在這個時代的探索高度,不妨就從百舸定義的AI infra強度開始。

圖片

       原文標題 : 百度智能云,造出了AI時代的擎天柱

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號