訂閱
糾錯(cuò)
加入自媒體

產(chǎn)業(yè)丨從WAIC2025看:算力競逐升維戰(zhàn),模型落地攻堅(jiān)時(shí)

前言:去年,AI領(lǐng)域的投資焦點(diǎn)仍集中在算力軍備競賽上,大型模型公司與科技巨頭紛紛投入巨資購置硬件,以提升模型性能。然而今年,隨著產(chǎn)業(yè)向縱深發(fā)展,投資評估的核心指標(biāo)已發(fā)生轉(zhuǎn)變,訂單增長率、毛利率、任務(wù)執(zhí)行效率及投資回報(bào)率等商業(yè)價(jià)值維度成為更關(guān)鍵的衡量標(biāo)準(zhǔn)。這些成本敏感型制造巨頭的采購,標(biāo)志著人形機(jī)器人正從展示型[奢侈品]轉(zhuǎn)變?yōu)榻鉀Q實(shí)際需求的[消費(fèi)品],開始創(chuàng)造真實(shí)經(jīng)濟(jì)價(jià)值。

作者 | 方文三

圖片來源 |  網(wǎng) 絡(luò) 

算力拐點(diǎn):國產(chǎn)突圍與超節(jié)點(diǎn)效能突破 

隨著大模型訓(xùn)練、智能交互、邊端側(cè)AI等應(yīng)用在各行業(yè)的廣泛滲透,對不同層級算力的需求呈現(xiàn)持續(xù)增長態(tài)勢。

在邊緣AI領(lǐng)域,國產(chǎn)芯片正從提升單芯片性能著手突破。

如果說追求極限性能設(shè)定了算力競賽的上限,那么深刻洞察多樣應(yīng)用場景則拓寬了這場競賽的邊界。

市場需求正快速演變,呈現(xiàn)兩大趨勢:

①企業(yè)出于數(shù)據(jù)安全考量,對大模型的私有化部署需求持續(xù)上升;

②訓(xùn)練與推理場景逐漸分離,不同應(yīng)用需要性價(jià)比各異的算力方案。

超節(jié)點(diǎn)架構(gòu)已成為國產(chǎn)算力規(guī);粐暮诵穆窂。

其興起表明,國產(chǎn)算力在單芯片技術(shù)上的差距可通過系統(tǒng)設(shè)計(jì)彌合,借助架構(gòu)革新實(shí)現(xiàn)集群效能超越。

這種針對AI場景的適應(yīng)性改進(jìn),是算力堆砌向?qū)嵱媚芰S遷的關(guān)鍵步驟。

算力產(chǎn)品:多維度創(chuàng)新成果集中亮相

本屆WAIC展會(huì)上,多家企業(yè)展示了最新算力產(chǎn)品,覆蓋芯片、顯卡、集群系統(tǒng)等全鏈條。

華為展出了Atlas900A3SuperPoD超節(jié)點(diǎn)集群。該集群基于超節(jié)點(diǎn)架構(gòu),包含12個(gè)計(jì)算柜和4個(gè)總線柜,整合了384顆昇騰910NPU和192顆鯤鵬920CPU,是當(dāng)前業(yè)界最大規(guī)模的超節(jié)點(diǎn)系統(tǒng)。 

摩爾線程展示了全功能GPU芯片及系列應(yīng)用產(chǎn)品,涵蓋MTTS80游戲顯卡和MTTS3000/4000智算中心顯卡。

其產(chǎn)品線實(shí)現(xiàn)從芯片到顯卡再到集群的完整布局,支持AI計(jì)算加速、3D圖形渲染、超高清視頻編解碼及科學(xué)計(jì)算等復(fù)合工作負(fù)載。

沐曦的展陳采用立體化方式,展品范圍從單顆芯片延伸至大型高密度算力機(jī)柜及散熱系統(tǒng)。

其最新發(fā)布的曦云C600GPU芯片基于國產(chǎn)供應(yīng)鏈設(shè)計(jì)制造,于今年7月完成回片。

該芯片采用自研GPGPU架構(gòu)與指令集,兼具通用計(jì)算與智能計(jì)算能力,自主化程度高。

現(xiàn)場展示的高密度算力POD融合了AI能源管理、GPU算效優(yōu)化、冷板式液冷散熱及彈性配電方案,支持8至128臺算力設(shè)備的靈活擴(kuò)展。

燧原科技帶來了S60AI推理加速卡及DeepSeek一體機(jī)樣機(jī)。

S60面向數(shù)據(jù)中心大規(guī)模部署,已應(yīng)用于美圖公司AI換裝功能及慶陽智算中心推理集群。

測試顯示,在BF16精度下,S60推理延時(shí)與海外同級產(chǎn)品持平且具備顯著性價(jià)比優(yōu)勢。

慶陽萬卡S60集群自2025年1月起已對外開放推理算力服務(wù)。

墨芯AI展出了支持32倍稀疏率的高性能可編程芯片Antoum,該芯片兼容CNN、RNN、Transformer等主流模型及多種數(shù)據(jù)類型,在視覺應(yīng)用中實(shí)現(xiàn)編解碼性能的突破性提升。

云天勵(lì)飛推出了完全自主研發(fā)的深界DeepEdge10系列芯片,基于國產(chǎn)工藝首創(chuàng)[算力積木]結(jié)構(gòu);

后摩智能發(fā)布的端邊大模型AI芯片后摩漫界M50,能在高效能下運(yùn)行1.5B到70B參數(shù)的本地模型;

此芯科技的此芯P1芯片也取得重大進(jìn)展,提供45TOPS端側(cè)算力,為邊緣AI提供強(qiáng)大支撐。

針對大型AI基礎(chǔ)設(shè)施,產(chǎn)業(yè)正從芯片堆疊轉(zhuǎn)向系統(tǒng)構(gòu)建,采用[超節(jié)點(diǎn)]來擴(kuò)展效能邊界。

超節(jié)點(diǎn)通過整合多臺服務(wù)器和多張算力卡,形成更大規(guī)模的算力單元,突破傳統(tǒng)部署限制。

這種聚合并非簡單疊加硬件,而是優(yōu)化節(jié)點(diǎn)內(nèi)互聯(lián)和液冷散熱等技術(shù),提升集群能效、通信帶寬和空間利用率,專門應(yīng)對復(fù)雜的大模型AI任務(wù)。

中興通訊推出光躍LightSphereX解決方案,作為全球首個(gè)分布式光互連光交換GPU超節(jié)點(diǎn)。

它基于曦智科技的分布式光交換技術(shù),結(jié)合硅光芯片、壁仞科技的大算力GPU液冷模組,并搭載中興AI服務(wù)器和儀電智算云軟件,構(gòu)建高帶寬、低延遲、可擴(kuò)展的自主智算集群。

神州數(shù)碼旗下神州鯤泰在大會(huì)上推出業(yè)界首款基于鯤鵬技術(shù)的大模型訓(xùn)練推理一體服務(wù)器KunTaiR624K2及推理服務(wù)器KunTaiR622K2。

KunTaiR624K2最高支持10張主流AI加速卡,計(jì)算性能較前代提升一倍;而KunTaiR622K2則在2U空間內(nèi)達(dá)到行業(yè)最高算力密度。

大模型落地:從參數(shù)競賽到產(chǎn)業(yè)深水區(qū)

2023年,超過20款機(jī)器人首次亮相;2024年,18臺人形機(jī)器人進(jìn)行了矩陣展示;今年,參展的智能機(jī)器人數(shù)量增至60余款,人形機(jī)器人總數(shù)達(dá)到150余臺。

今年WAIC通過深度剖析大模型技術(shù)路徑和探索AI法治體系,以多線并進(jìn)的方式,全面釋放AI時(shí)代的關(guān)鍵信號。

大語言模型理解語言的方式如同多維樂高積木,每個(gè)詞都代表多維度特征集合。

這種認(rèn)知深化正推動(dòng)全球AI產(chǎn)業(yè)從單純參數(shù)競賽轉(zhuǎn)向更注重實(shí)際價(jià)值創(chuàng)造的新階段。

在WAIC2025上,各廠商紛紛推出AI新品以展示戰(zhàn)略方向,這些動(dòng)態(tài)不限于技術(shù)層面的常規(guī)迭代,更揭示了AI正從輔助工具向產(chǎn)業(yè)核心要素的根本轉(zhuǎn)變。

從具身智能的實(shí)際應(yīng)用落地,到AI智能體功能的深度拓展,再到算力與模型創(chuàng)新的大步跨越,AI全方位滲透各行業(yè)的底層架構(gòu),重塑產(chǎn)業(yè)運(yùn)作邏輯與發(fā)展路徑。

模型廠商正集體從云端轉(zhuǎn)向?qū)嶋H產(chǎn)業(yè),告別純粹的參數(shù)競爭與技術(shù)展示,深入產(chǎn)業(yè)核心地帶,發(fā)掘應(yīng)用場景,構(gòu)建生態(tài)系統(tǒng),開啟技術(shù)商業(yè)化的探索之旅。

模型與產(chǎn)業(yè)場景的深度融合至關(guān)重要,因?yàn)槲ㄓ性谡鎸?shí)環(huán)境中,AI才能獲取新穎、高質(zhì)量且蘊(yùn)含物理規(guī)律的數(shù)據(jù),推動(dòng)更高維度的進(jìn)化。

產(chǎn)業(yè)已邁入回歸客戶需求、扎根實(shí)際應(yīng)用場景的新階段。

從市場進(jìn)展觀察,大模型的終極形態(tài)尚需漫長路程,隨著開源模型與封閉模型性能趨近,僅憑模型在國內(nèi)難以實(shí)現(xiàn)顯著差異化;因此,找準(zhǔn)自身產(chǎn)業(yè)生態(tài)位變得尤為關(guān)鍵。

 

WAIC2025釋放三大產(chǎn)業(yè)趨勢 

WAIC2025釋放出明確信號:AI正突破符號指令的局限,通過具身化載體深度融入細(xì)分場景。展會(huì)熱度背后,三大AI產(chǎn)業(yè)趨勢逐漸清晰:

①模型研發(fā)轉(zhuǎn)向追求極致[推理效率]:參數(shù)規(guī)模競爭讓位于效能優(yōu)化,ScalingLaw邊際收益遞減推動(dòng)行業(yè)聚焦[低成本、高并發(fā)]推理方案。

阿里開源三款新模型:Qwen3推理模型性能比肩Gemini2.5Pro;Qwen3-Coder登頂HuggingFace總榜,帶動(dòng)API調(diào)用量三日突破千億Tokens。

商湯科技發(fā)布日日新V6.5多模態(tài)大模型,原生集成感知導(dǎo)航能力,推理吞吐量提升35%+,多模態(tài)性能超越GPT-4o與Gemini2.5Flash,實(shí)現(xiàn)5倍性價(jià)比躍升。

階躍星辰推出Step3系列模型,在國產(chǎn)芯片推理效率達(dá)DeepSeek-R1的300%。

②算力升級演進(jìn)為系統(tǒng)級[超級工廠]:MoE架構(gòu)、混合精度、量化剪枝與實(shí)時(shí)擴(kuò)展(Test-TimeScaling)等技術(shù)組合,推動(dòng)模型實(shí)現(xiàn)[邊推理邊計(jì)算],以更低算力獲取更高精度。

③應(yīng)用場景延伸至物理世界[自主執(zhí)行]:未來兩年市場競爭核心在于,同等算力預(yù)算內(nèi),誰能交付更優(yōu)性能,誰將掌握產(chǎn)業(yè)主動(dòng)權(quán)。

結(jié)尾:

從WAIC2025的諸多動(dòng)態(tài)中不難看出,AI產(chǎn)業(yè)正經(jīng)歷從技術(shù)狂熱到理性落地的關(guān)鍵轉(zhuǎn)折。

算力競賽不再是單純的性能堆砌,而是通過超節(jié)點(diǎn)架構(gòu)、國產(chǎn)芯片突圍與場景化方案設(shè)計(jì),在效能、成本與安全間找到精準(zhǔn)平衡;

大模型也告別了[參數(shù)為王]的時(shí)代,轉(zhuǎn)而深耕產(chǎn)業(yè)場景,以推理效率提升、生態(tài)位構(gòu)建與實(shí)際價(jià)值創(chuàng)造為核心目標(biāo)。

部分資料參考:

鏡相工作室:《在WAIC,比起看機(jī)器人打拳,人們更想知道怎么用AI賺錢》

頭部科技:《國產(chǎn)AI算力逆風(fēng)起飛,多種技術(shù)路徑大突圍》

經(jīng)濟(jì)觀察報(bào):《WAIC2025觀察:算力競賽升維,模型尋路落地》

財(cái)聯(lián)社:《WAIC2025閉幕:參觀人數(shù)預(yù)超35萬次,投資額超150億》

物聯(lián)網(wǎng)智庫:《WAIC2025:從技術(shù)破局到場景應(yīng)用深入,AI實(shí)踐開始跨越三大拐點(diǎn)》

       原文標(biāo)題 : AI芯天下丨產(chǎn)業(yè)丨從WAIC2025看:算力競逐升維戰(zhàn),模型落地攻堅(jiān)時(shí)

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號