直擊WAIC:大模型走進(jìn)“中場戰(zhàn)事”
文/熊逾格
編輯/陳鋒
7月末,上海世博展覽館人潮如織,2025 WAIC迎來史無前例的熱度。
科技盛宴背后,2025年以來,國內(nèi)大模型產(chǎn)業(yè)的三大趨勢愈發(fā)清晰,競爭版圖正在重塑:
推理模型成為新的技術(shù)制高點(diǎn);應(yīng)用落地從概念走向?qū)崙?zhàn);國產(chǎn)算力迎來突破性進(jìn)展。
從DeepSeek的開源風(fēng)暴到華為昇騰384超節(jié)點(diǎn)的首次亮相,從“六小虎”的差異化布局到巨頭的全面反擊,大模型正告別“百模大戰(zhàn)”的混沌期,步入更加理性而激烈的“中場戰(zhàn)事”。
WAIC 2025現(xiàn)場,圖源世界人工智能大會官方微信公眾號
我們看到,2025 WAIC上,在去年顯得低調(diào)的機(jī)器人產(chǎn)業(yè)變得火熱,相關(guān)公司由2024年的18家劇增到80家,占領(lǐng)幾乎整個展館二層H3展館,火熱非凡。而大模型廠商們則主要集中在一層H1展館。
今年,“AI六小虎”中的零一萬物、百川智能并未現(xiàn)身, BAT、科大訊飛等頭部廠商展位不再專注比拼模型參數(shù),而是展示出多樣的落地生態(tài)。
如今,大模型競爭已不再是單純的技術(shù)軍備競賽,而是一場關(guān)乎產(chǎn)業(yè)生態(tài)、商業(yè)模式和國際競爭力的綜合較量。當(dāng)大模型從實驗室走向產(chǎn)業(yè)一線,推理能力成為新的分水嶺,國產(chǎn)化成為不可逆轉(zhuǎn)的趨勢,每一個參與者都在重新審視自己的定位和實力。
1、一場推理模型的“百花齊放”
如果說2025年以前的“百模大戰(zhàn)”更多是在基礎(chǔ)能力上的比拼,推理模型則代表了從“能回答”到“會思考”的質(zhì)的飛躍。
這一轉(zhuǎn)折點(diǎn)的標(biāo)志性事件,無疑是DeepSeek-R1的橫空出世。
據(jù)業(yè)內(nèi)分析,DeepSeek-R1的訓(xùn)練成本僅為560萬美元,遠(yuǎn)低于美國AI公司的數(shù)千萬美元乃至數(shù)億美元投入。更重要的是,這一技術(shù)突破開啟了推理模型的“平民化”路徑,讓原本高不可攀的AGI研究變得相對可及。
面對變局,頭部廠商迅速跟進(jìn)。WAIC上推理模型的“百花齊放”,闡釋著大模型競爭規(guī)則的變化。
據(jù)不完全統(tǒng)計,自2025年1月DeepSeek-R1發(fā)布以來,頭部廠商和大模型創(chuàng)業(yè)公司,在在短短數(shù)月內(nèi)相繼推出了自己的推理模型。
3月,騰訊發(fā)布混元T1正式版,百度發(fā)布文心X1;阿里發(fā)布QwQ-32B推理模型;
4月,字節(jié)發(fā)布Seed-Thinking-v1.5;阿里發(fā)布通義千問Qwen3推理模型;
6月,騰訊發(fā)布混元-A13B;
7月,智譜發(fā)布GLM-4.5,階躍星辰發(fā)布Step3,科大訊飛星火X1迎來第二次升級,月之暗面發(fā)布Kimi K2。
WAIC 2025的騰訊展臺,圖源騰訊優(yōu)圖實驗室官方微信公眾號
WAIC前后,國內(nèi)大模型廠商展示自家最新推理模型,呈現(xiàn)出在技術(shù)路線上明顯的差異化策略,主要體現(xiàn)在模型架構(gòu)、推理機(jī)制、參數(shù)策略及成本三方面:
首先是架構(gòu)選擇、創(chuàng)新的分野。大模型架構(gòu)從純Transformer走向混合架構(gòu)時代,單一架構(gòu)已無法滿足推理模型的性能需求,混合架構(gòu)成為新的技術(shù)制高點(diǎn)。
騰訊的混元T1正式版,摒棄純Transformer架構(gòu),轉(zhuǎn)而將混合Mamba架構(gòu)應(yīng)用于推理大模型,實際生成速度快于DeepSeek-R1;
月之暗面的Kimi K2、阿里的Qwen3推理模型、字節(jié)的Seed-Thinking-v1.5、智譜的GLM-4.5、階躍星辰的Step3均采用MoE架構(gòu)。
其次是推理機(jī)制創(chuàng)新,更適合場景應(yīng)用以及Agent發(fā)展。
百度的文心X1,采用“思維鏈-行動鏈”協(xié)同訓(xùn)練,在復(fù)雜任務(wù)中自動拆解為二十多個推理步驟,同時可以調(diào)用十幾種的工具鏈,增強(qiáng)Agent的能力;
科大訊飛的星火X1使用“快思考+慢思考”統(tǒng)一模型架構(gòu),通用推理能力與專業(yè)領(lǐng)域推理并重;
月之暗面的Kimi2主打代碼能力和Agentic任務(wù)處理,針對軟件工程任務(wù)進(jìn)行了專門優(yōu)化;
階躍星辰的Step3創(chuàng)新引入MFA注意力機(jī)制和AFD分布式推理系統(tǒng);
智譜的GLM-4.5首次在單個模型中實現(xiàn)推理、編碼和智能體能力的原生融合,支持思考模式和非思考模式切換。
最后是參數(shù)策略的強(qiáng)調(diào),在效率、成本、速度之間尋找平衡。
Kimi K2擁有32B激活參數(shù)和1T總參數(shù),是目前業(yè)界總參數(shù)量最大的開源模型;
Seed-Thinking-v1.5參數(shù)量降低至200B總參數(shù)和20B激活參數(shù),輕量化趨勢明顯;
阿里QwQ-32B采用32B參數(shù)規(guī)模,顯存需求控制在24GB,大幅降低部署門檻;
騰訊混元A13B總參數(shù)80B、激活參數(shù)僅13B,1張中低端GPU即可部署。
WAIC 2025阿里展臺,圖源通義靈碼官方微信公眾號
當(dāng)下,推理模型的競爭已不再局限于參數(shù)規(guī)模和算力消耗,模型的推理鏈條設(shè)計、多步驟邏輯處理能力以及與下游任務(wù)的適配性,正成為新的評價維度。
這場推理模型的軍備競賽,實質(zhì)上是各家廠商對未來AI發(fā)展方向的不同押注。開源還是閉源,通用還是專用,效率還是效果,每一個選擇都將決定其在下一階段競爭中的位置。
而隨著推理模型技術(shù)的日趨成熟,真正的較量更轉(zhuǎn)向應(yīng)用場景的爭奪。
2、從B到C,大模型落地拼什么?
在推理模型解決“思考”問題后,應(yīng)用落地展示出“為誰想”和“想什么”的關(guān)鍵方向。2025年的WAIC展會上,最引人注目的變化莫過于大模型從“技術(shù)展示”向“應(yīng)用實戰(zhàn)”的轉(zhuǎn)變。
這一轉(zhuǎn)變首先體現(xiàn)在WAIC廠商策略的分化上——互聯(lián)網(wǎng)巨頭依靠平臺生態(tài)及能力,不斷在B端、C端廣泛布局;專業(yè)模型廠商選擇垂直賽道深化,選擇B端作為突圍出口。
其中,騰訊展示出混元大模型“從云到端”的完整展示鏈路,以及B端金融分析助手、智能視頻剪輯、媒體內(nèi)容生成等內(nèi)容,頗為吸睛的亮點(diǎn)在于社交——在微信中添加“騰訊元寶”好友,能讓14億微信用戶像加好友一樣接觸AI助手。
阿里側(cè)重在AI工具帶給生活的便利性。
比如,通義大模型技術(shù)底座支撐下,天貓精靈全屋智能構(gòu)建的空間智能體系,讓用戶現(xiàn)場體驗AI影音搜推、AI K歌、AI健身等豐富場景;通義APP融合AI翻譯、AI對話、AI語音通話三大功能,成為用戶的“貼身伙伴”。
通義千問+釘釘辦公智能體能夠自動生成項目推進(jìn)表、會議紀(jì)要、日報匯總,集成知識庫管理、權(quán)限控制與RPA能力。
百度聚焦百舸GPU算力平臺、“萬源”智能計算操作系統(tǒng)等AI基礎(chǔ)設(shè)施,配合文心大模型技術(shù)底座,進(jìn)而推出慧播星、文心快碼、“萬源”智能計算操作系統(tǒng)、AI升級的百度文庫及百度網(wǎng)盤等產(chǎn)品。
WAIC 2025百度展臺的網(wǎng)盤、文庫展示,圖源百度網(wǎng)盤服務(wù)號官方微信公眾號
另一方面,Kimi、智譜AI等廠商缺乏大廠的流量優(yōu)勢,展示內(nèi)容更加注重B端能力。
其中,Kimi、智譜AI,對標(biāo)Claude偏向強(qiáng)調(diào)編程、智能體的能力。
智譜AI的CogAgent平臺支持訓(xùn)練個性化對話體,快速封裝為智能客服、內(nèi)容助手等角色,并擁有私有知識庫、多模態(tài)API與流程自定義等功能。智譜此前表示,GLM-4.5的API價格僅為Claude的1/10,速度可達(dá)100tokens/秒。
Kimi推出Kimi-Researcher深度研究智能體,新推出的Kimi K2在代碼能力和Agentic任務(wù)處理上優(yōu)勢明顯,也能夠完成AI商務(wù)寫作+智能表格分析一體化流程。
WAIC 2025的kimi演示“AI商務(wù)寫作+智能表格分析”一體化流,圖源藍(lán)馳創(chuàng)投官方微信公眾號
“六小虎”的其中兩家,Minimax和階躍星辰則更加注重多模態(tài)能力。
階躍星辰新一代多模態(tài)大模型Step 3能力覆蓋文字、語音、圖像、視頻、音樂、推理,稱國內(nèi)Top10手機(jī)廠商過半都已接入階躍的多模態(tài)能力,OPPO、榮耀、中興的旗艦機(jī)型都已搭載適配,合作伙伴還包括吉利汽車、智元機(jī)器人等企業(yè),預(yù)計2025年全年收入近10億人民幣。
MiniMax的MiniMax Agent智能體平臺,能夠進(jìn)行長程復(fù)雜任務(wù)處理,替代專業(yè)人士一周工作量,深入網(wǎng)頁開發(fā)、深度調(diào)研等垂直領(lǐng)域應(yīng)用,支持釘釘、飛書、企業(yè)微信等辦公系統(tǒng)集成。
不難看出,在應(yīng)用形態(tài)上,Agent成為最具想象力的落地方向。
但根植于當(dāng)下環(huán)境——近期C端通用Agent明星產(chǎn)品Manus總部遷移至新加坡、國內(nèi)裁員80人并放棄國內(nèi)版本上線,大模型廠商們更注重垂直Agent能力的開發(fā)。
以落地場景來說,值得關(guān)注的還有大模型在垂直行業(yè)的滲透加速。
例如,在金融領(lǐng)域,風(fēng)控、投顧、客服等環(huán)節(jié)都在積極引入大模型技術(shù);在醫(yī)療領(lǐng)域,診斷輔助、藥物研發(fā)、病歷管理等應(yīng)用場景不斷涌現(xiàn);在制造業(yè),智能質(zhì)檢、預(yù)測性維護(hù)、供應(yīng)鏈優(yōu)化等用例逐步落地。
綜合來看,大模型的應(yīng)用落地實際上是一場綜合實力的競賽。
技術(shù)能力是基礎(chǔ),但產(chǎn)品化能力、生態(tài)整合能力、客戶服務(wù)能力同樣重要,能夠在這些維度上形成差異化優(yōu)勢的廠商,才有可能在應(yīng)用落地的競爭中勝出。
3、國產(chǎn)算力曙光乍現(xiàn)
在大模型產(chǎn)業(yè)的所有變量中,算力無疑是最具戰(zhàn)略意義的一環(huán)。
近期,黃仁勛訪華為國產(chǎn)算力發(fā)展提供新的視角。在接受央視采訪時對,黃仁勛表示華為AI芯片取代英偉達(dá)或許只是時間問題,也讓人更加期待國產(chǎn)算力的潛力。
據(jù)公開資料,阿里、字節(jié)跳動近幾個月的日均Token調(diào)用量增長相比一年前均接近、超過100倍,這種爆發(fā)式增長對算力供給提出了巨大挑戰(zhàn)。
在2025年的WAIC展會上,國產(chǎn)算力展現(xiàn)出前所未有的實力和信心。
作為“八大鎮(zhèn)館之寶”之一,華為昇騰384超節(jié)點(diǎn)首次實機(jī)展出。昇騰384超節(jié)點(diǎn)基于超節(jié)點(diǎn)架構(gòu),通過總線技術(shù)實現(xiàn)384個NPU之間的大帶寬低時延互聯(lián),解決集群內(nèi)計算、存儲等各資源之間的通信瓶頸。
WAIC 2025的華為昇騰384超節(jié)點(diǎn),圖源世界人工智能大會微信公眾號
這樣的突破意義不僅在于算力規(guī)模的提升,更在于為國產(chǎn)大模型訓(xùn)練提供了可靠的底層支撐。
國產(chǎn)GPU廠商的表現(xiàn)同樣令人矚目。燧原科技的新一代人工智能推理加速卡“燧原S60”,對標(biāo)英偉達(dá)L20,搭載了48G顯存和PCIe 5.0接口,支持各種主流推理框架和200+主流模型,可滿足千億參數(shù)大模型的推理需求。
在 今年 2月 與美圖旗下美顏相機(jī)的合作中, 燧原 科技僅用 4天時間就完成了近萬張推理卡的上線部署, 解決 “AI換裝”功能爆火 帶來的需求 。
此外,國產(chǎn)算力還展現(xiàn)出從單點(diǎn)突破轉(zhuǎn)向生態(tài)協(xié)同的趨勢。7月,階躍星辰聯(lián)合華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯等近10家芯片及基礎(chǔ)設(shè)施廠商發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”。
國產(chǎn)算力的發(fā)展仍面臨諸多挑戰(zhàn)。在芯片性能上,國產(chǎn)算力與國際先進(jìn)水平仍有差距;在軟件生態(tài)上,開發(fā)工具鏈和優(yōu)化算法還需要進(jìn)一步完善;在大規(guī)模部署上,穩(wěn)定性和可靠性還需要更多驗證。
但我們不妨更加樂觀。技術(shù)路徑的多樣化為后發(fā)追趕創(chuàng)造了機(jī)會,龐大的國內(nèi)市場為產(chǎn)業(yè)化提供了基礎(chǔ),政策支持為創(chuàng)新發(fā)展提供了保障。
更重要的是,WAIC上AI產(chǎn)業(yè)呈現(xiàn)出的快速發(fā)展,更讓人看到國產(chǎn)算力發(fā)展的歷史性窗口。
4、結(jié)語
當(dāng)WAIC的熱潮逐漸退去,大模型產(chǎn)業(yè)的“中場戰(zhàn)事”才剛剛開始。這不再是一場單純的技術(shù)競賽,而是涉及技術(shù)路徑、商業(yè)模式、生態(tài)建設(shè)和國際競爭的全方位較量。
中場戰(zhàn)事的核心特征是分化與聚焦。
分化體現(xiàn)在技術(shù)路徑的多元化、應(yīng)用場景的專業(yè)化和商業(yè)模式的差異化;聚焦則體現(xiàn)在核心技術(shù)的攻堅、關(guān)鍵應(yīng)用的突破和生態(tài)護(hù)城河的構(gòu)建。
這種變化趨勢預(yù)示著大模型產(chǎn)業(yè)正在從高速擴(kuò)張期進(jìn)入精耕細(xì)作期。
展望未來,三大趨勢將繼續(xù)深化:推理模型將從當(dāng)前的邏輯推理擴(kuò)展到多模態(tài)推理和具身智能推理;應(yīng)用落地將從工具型應(yīng)用發(fā)展為平臺型應(yīng)用和生態(tài)型應(yīng)用;國產(chǎn)算力從追趕模式轉(zhuǎn)向比拼模式,在某些細(xì)分領(lǐng)域?qū)崿F(xiàn)領(lǐng)先。
中場戰(zhàn)事的勝負(fù),最終將由應(yīng)用價值和用戶選擇來裁判。WAIC熱潮落幕后,留在舞臺中心的國內(nèi)大模型產(chǎn)業(yè)路在何方,仍待進(jìn)一步驗證。
原文標(biāo)題 : 直擊WAIC:大模型走進(jìn)“中場戰(zhàn)事”

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
8月5日立即報名>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
-
8月14日立即報名>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進(jìn)化