訂閱
糾錯
加入自媒體

國產(chǎn)GPU,要把算力搬到太空!

貝克街探案官

作者魯鎮(zhèn)西

搶回英偉達扔掉的500億美元,摩爾線程們還能做什么?

2025年11月,長達7年的“國產(chǎn)芯片替代”,終于迎來大眾肉眼可見的成果。

首先是黃仁勛宣布正式退出中國市場,高端芯片市場份額從95%降至0%‌,預計將失去500億美元營收,其次中國GPU企業(yè)摩爾線程,于11月24日摩爾線程(sh688795)正式申購,這意味著主要從事GPU及相關(guān)產(chǎn)品的研發(fā)、設(shè)計和銷售,號稱國內(nèi)唯一實現(xiàn)全功能GPU量產(chǎn)的企業(yè),初步獲得市場認可。

圖源:摩爾線程官網(wǎng)

只是礙于科創(chuàng)板門檻兒,申購者需要開戶滿2年;申請日前20個交易日中,日均持倉不低于50萬元;風險承受能力等級需為C4(積極型)及以上,并簽署《科創(chuàng)板股票交易風險揭示書》。

按摩爾線程發(fā)行價114.28元每股計算,中一簽需要本金57140元,由于近期新股大鵬工業(yè)首日暴漲12倍,最高漲幅超1500%,市場對摩爾線程上市當日的漲幅預期極高,紛紛預測中一簽摩爾線程最少盈利十萬元。

且不論這種預測是否準確,從摩爾線程IPO進程來看,公司從申請受理到過會僅用88天,刷新了科創(chuàng)板審核速度紀錄。實際上,二級市場反哺企業(yè)融資提速,恰好表明國產(chǎn)GPU研發(fā)加速落地。

01摩爾線程的硬實力

此次上市的摩爾線程,成立時間不過5年,自2020年設(shè)立至今,公司以自主研發(fā)的全功能GPU為核心,致力于為AI、數(shù)字孿生、科學計算等高性能計算領(lǐng)域提供計算加速平臺。

短短5年中,摩爾線程已成功推出四代GPU架構(gòu),并形成了覆蓋AI智算、高性能計算、圖形渲染、計算虛擬化、智能媒體和面向個人娛樂與生產(chǎn)力工具等應用領(lǐng)域的多元計算加速產(chǎn)品矩陣,產(chǎn)品線涵蓋政務與企業(yè)級智能計算、數(shù)據(jù)中心及消費級終端市場,能夠滿足政府、企業(yè)和個人消費者等在不同市場中的差異化需求。

新一代架構(gòu)相關(guān)產(chǎn)品處于研發(fā)階段,同步推進高性能GPU芯片和智算集群前沿技術(shù)預研,以自主創(chuàng)新為核心,持續(xù)推動計算產(chǎn)業(yè)向通用化與智能化方向發(fā)展。

圖源:摩爾線程招股書

值得一提的是,退出中國高端GPU市場的英偉達,賴以生存的就是“CUDA”,英偉達憑借CUDA構(gòu)建了極高的軟件生態(tài)壁壘。為沖破這個壁壘,摩爾線程自主研發(fā)MUSA架構(gòu)。

MUSA架構(gòu)是公司自主研發(fā)的融合GPU硬件和軟件的全功能GPU計算加速統(tǒng)一系統(tǒng)架構(gòu)。該架構(gòu)涵蓋統(tǒng)一的芯片架構(gòu)、指令集、編程模型、軟件運行庫及驅(qū)動程序框架等關(guān)鍵要素,旨在為各類并行計算場景提供高性能計算能力。

開發(fā)人員可借助C/C++、Triton等編程語言,在該架構(gòu)下編寫并行計算程序,且同一代碼能夠在公司不同GPU產(chǎn)品及系統(tǒng)上運行,具有良好的靈活性與可擴展性。

最重要的是,MUSA架構(gòu)具備與由英偉達主導的國際主流GPU生態(tài)的兼容性,使得開發(fā)者能夠以較低成本充分利用目前國際主流生態(tài)下的代碼資源。基于MUSA架構(gòu)開發(fā)的應用程序不僅具有廣泛的可移植性,還能夠同時在云端及邊緣的眾多計算平臺上運行,其應用領(lǐng)域廣泛,涵蓋AI、圖形處理、科學計算等多個重要方向。

全功能GPU是指具備功能完備性與精度完整性的GPU。其中,功能完備性體現(xiàn)為在單一GPU芯片中集成了AI計算加速、圖形渲染、物理仿真和科學計算、超高清視頻編解碼等多種能力,滿足多樣化的計算需求;精度完整性體現(xiàn)為單一芯片支持FP64Vector、FP32Vector、TF32Tensor、FP16/BF16Tensor、FP8Tensor、INT8Tensor等不同計算精度,以滿足GPU加速不同場景的計算需求。

全功能GPU在工作效率、生態(tài)完整多樣性以及兼容性等方面更具有優(yōu)勢,能夠更好地適應未來新興及前沿計算加速應用場景的需求。

基于MUSA統(tǒng)一架構(gòu)技術(shù),摩爾線程在基礎(chǔ)軟件層面同時提供了AI計算、圖形渲染和科學計算所需的基礎(chǔ)軟件技術(shù)。

在AI計算領(lǐng)域,支持PyTorch、PaddlePaddle等國內(nèi)外主流AI應用開發(fā)框架,以及Megatron、FlagScale等大模型分布式訓練框架;在圖形渲染領(lǐng)域,支持DirectX、OpenGL、OpenGLES和Vulkan等主流圖形應用開發(fā)技術(shù),為視頻游戲、數(shù)字孿生、虛擬現(xiàn)實、工業(yè)設(shè)計和地理信息系統(tǒng)等行業(yè)應用提供堅實基礎(chǔ);在科學計算領(lǐng)域,支持MUSA通用計算編程,可廣泛應用于計算物理、信號處理、生物醫(yī)藥等科學計算領(lǐng)域。

在招股書中,摩爾線程特別強調(diào),MUSA架構(gòu)本身并不作為單獨產(chǎn)品對外銷售,而是作為公司全功能GPU產(chǎn)品的核心技術(shù)支撐。

02機會留給了有準備的MUSA,國產(chǎn)算力迎來加速時刻

今天的MUSA架構(gòu),間接證明摩爾線程設(shè)立初期就錨定英偉達替代。

俗話說機會留給有準備的人,如今的英偉達,因為種種原因徹底退出中國高端GPU市場,而摩爾線程MUSA架構(gòu)恰好可以兼容英偉達CUDA架構(gòu),在英偉達高端GPU退出中國市場的今天,摩爾線程MUSA架構(gòu)似乎可以無縫銜接英偉達市場,國產(chǎn)算力行業(yè)有望借此實現(xiàn)加速落地。

基于MSUA架構(gòu),摩爾線程已經(jīng)推出四代GPU架構(gòu)芯片,分別為“蘇堤”“春曉”“曲院”“平湖”,第四代芯片“平湖”增加了FP8精度支持,大幅提升AI算力,公司基于該芯片支撐面向DeepSeek類前沿大模型預訓練的萬卡集群智算中心解決方案。

基于MUSA架構(gòu),摩爾線程推出智能SoC芯片“長江”,這是集成了“全功能GPU+CPU+NPU+VPU”等異構(gòu)算力單元的片上系統(tǒng)芯片。

摩爾線程AI算力本是基于“長江”SoC打造的產(chǎn)品,結(jié)合AI大模型與傳統(tǒng)PC功能,為用戶提供智能化的計算終端。該產(chǎn)品在滿足傳統(tǒng)PC功能的基礎(chǔ)上,支持AI應用的運行與開發(fā),用戶可進行AI學習和實踐操作。同時,AI算力本支持端云聯(lián)動,用戶可通過云端進行模型訓練,將訓練完成的模型下發(fā)至本地進行推理,實現(xiàn)個性化算力定制,滿足快速、高效、隱私保護的推理需求。

除兼容英偉達CUDA架構(gòu)的摩爾線程MUSA架構(gòu)外,國產(chǎn)算力還有一個繞不開的玩家就是華為,2025年6月20日,華為在開發(fā)者大會發(fā)布CloudMatrix384AI超節(jié)點,將384顆昇騰NPU和192鯤鵬CPU通過全新高速網(wǎng)絡MatrixLink對等互連形成了一個整體AI“服務器”。算力已從單臺的6.4pFLOPS提升至超節(jié)點300pFLOPS,算力提升50倍。單卡的推理吞吐量從每秒600tokens提升至每秒2300tokens,提升近4倍。

實際測試中在默認配置下,總體預填吞吐量的測試CloudMatrix-Infer每個NPU每秒處理5655tokens。鑒于每個昇騰910CNPU的計算能力為1504TFLOPS(INT8),對應的計算效率為3.76tokens/sperTFLOPS。這比SGLang在英偉達H100上的默認配置(3.18tokens/sperTFLOPS)效率要高得多,盡管后者的原始吞吐量略高。

另一個老玩家龍芯中科也推出了新一代CPU及GPGPU,2025年龍芯產(chǎn)品發(fā)布會上,龍芯中科發(fā)布最新一代3C6000系列處理器。

龍芯3C6000系列處理器具備高性能,高可靠,高安全,高能效的特點。本次產(chǎn)品主要打造了5種服務器主板方案(3C6000/S單路、雙路;3C6000/D雙路;3C6000/Q雙路;3C6000/D四路)主要針對不同應用群體,服務器性能全面對標Intel第三代至強服務器系列,基本達到2023年市場主流產(chǎn)品水平,實測中64核心雙路和32核心四路產(chǎn)品整機性能比較Intel的8380有小幅優(yōu)勢。

在工控領(lǐng)域本次發(fā)布會發(fā)布了龍芯2K3000:采用8核SoC芯片,龍芯自主指令系統(tǒng)(龍架構(gòu)),基于自主研制的LA364E處理器核,SPECCPU2006Base單線程定/浮點峰值性能均超過10分/GHz,與龍芯3A5000處理器使用的LA464核性能相當;集成第二代自研GPGPU核心LG200,圖形性能成倍提升,支持通用計算和AI加速;集成豐富的I/O接口,可廣泛應用于各種場景。

公司針對未來GPU芯片發(fā)展方向,發(fā)布首款GPU芯片9A1000:其定位是入門級的顯卡并且支持AI加速,AI算力預計在40TOPS,相較于公司上一代2K3000性能提升5倍以上,產(chǎn)品目前已經(jīng)在研發(fā)尾聲,即將進入流片。下一代9A2000單精度浮點算力可達到5TFlops,INT8AI算力達到160TOPS,內(nèi)存帶寬256BG/s,并且支持雙片互聯(lián)拓展。

結(jié)語

在國產(chǎn)GPU市場,像摩爾線程、華為、龍芯中科這幾家公司只是冰山一角,海光信息、寒武紀、景嘉微、沐曦集成等多家公司均聚焦GPU產(chǎn)品,為國產(chǎn)算力替代提供無限可能。

2025年11月消息,北京擬在700-800公里晨昏軌道建設(shè)運營超過千兆瓦(GW)功率的集中式大型數(shù)據(jù)中心系統(tǒng),以實現(xiàn)將大規(guī)模AI算力搬上太空。

根據(jù)“智繪星空勝算在天——太空數(shù)據(jù)中心建設(shè)工作推進會”發(fā)布的規(guī)劃方案,數(shù)據(jù)中心系統(tǒng)由空間算力、中繼傳輸和地面管控分系統(tǒng)組成。數(shù)據(jù)中心建設(shè)分為三個階段,2025年至2027年,突破能源與散熱等關(guān)鍵技術(shù),迭代研制試驗星,建設(shè)一期算力星座;2028年至2030年,突破在軌組裝建造等關(guān)鍵技術(shù),降低建設(shè)與運營成本,建設(shè)二期算力星座;2031年至2035年,衛(wèi)星大規(guī)模批量生產(chǎn)并組網(wǎng)發(fā)射,在軌對接建成大規(guī)模太空數(shù)據(jù)中心。

在此之前,浙江之江實驗室于2025年5月14日,發(fā)射12顆衛(wèi)星,搭載80億參數(shù)模型,實現(xiàn)整軌互聯(lián),計劃擴展至千星規(guī)模,為全球首個太空計算星座。

通常,衛(wèi)星需先將數(shù)據(jù)傳回地面,再由地面數(shù)據(jù)處理中心對其進行解析,這種“天感地算”的模式受限于地面站資源、帶寬等因素,僅有不到十分之一的有效衛(wèi)星數(shù)據(jù)能傳回地面,且存在數(shù)據(jù)時效差等問題,之江實驗室構(gòu)建的“三體計算星座”恰好著力攻克該問題。

中國之所以可以大力發(fā)展太空算力,一個重要前提就是實現(xiàn)國產(chǎn)算力替代后,算力建設(shè)外溢,如果成功,這將是解決傳統(tǒng)數(shù)據(jù)中心“用電 / 冷卻 /土地 /碳排放 /擴容難”等問題的一條全新路徑。尤其對AI、大模型訓練/推理這類對算力密集、能耗大的任務——太空算力或?qū)⒊蔀?ldquo;綠色高密度計算平臺”。

長期來看,如果太空算力可以落地,未來“天基算力星座+地面云+太空云+混合部署”可能成為主流算力基礎(chǔ)設(shè)施格局。不僅僅是云+地面數(shù)據(jù)中心,而是云+地+空多維融合。

其次可以減少對地面能源/電力/土地/冷卻資源的依賴,使得AI/超級計算/大模型訓練更綠色/更可持續(xù)。這對碳中和/節(jié)能/資源利用/可持續(xù)發(fā)展有重要意義。

第三可以推動“太空+商業(yè)航天+AI+通信+新能源+基礎(chǔ)設(shè)施”跨界產(chǎn)業(yè)鏈大發(fā)展。既是科技,也是基礎(chǔ)設(shè)施、戰(zhàn)略資產(chǎn)?赡艽龠M新的產(chǎn)業(yè)形態(tài)、新商業(yè)模式與新服務類型誕生。

第四可以實現(xiàn)戰(zhàn)略自主、數(shù)據(jù)主權(quán)、安全角度的基礎(chǔ)設(shè)施重構(gòu)。太空中的算力與數(shù)據(jù)處理可能更受控,更利于“主權(quán)云/主權(quán)算力/國家安全+數(shù)據(jù)安全”——對于一些敏感場景(政府、國防、衛(wèi)星偵察、遙感監(jiān)控、重大科研等)尤為重要。

著重構(gòu)建太空算力,是中國在“算力基礎(chǔ)設(shè)施+國家戰(zhàn)略+商業(yè)航天”交匯處的一次重大布局。它的重要性不亞于幾十年前地面互聯(lián)網(wǎng)基礎(chǔ)設(shè)施的建設(shè),而這一切的基礎(chǔ),是國內(nèi)GPU企業(yè)可以穩(wěn)定產(chǎn)出優(yōu)質(zhì)GPU產(chǎn)品。

摩爾線程等新玩家成功上市,有望借助資本的力量進一步提升企業(yè)實力,后續(xù)還有沐曦股份(sh688802)等陸續(xù)登陸科創(chuàng)板,為國產(chǎn) GPU 行業(yè)帶來大量資金、媒體與人才回流、供應鏈驗證與政府支持信號;中長期則可能推動產(chǎn)品化規(guī)模擴張、生態(tài)建設(shè)與國產(chǎn)替代提速。

© THE END

素材皆來自官方公開資料

本文不構(gòu)成任何投資建議。

頭圖由百度AI生成

本文由貝克街探案官原創(chuàng),未經(jīng)許可,請勿轉(zhuǎn)載。

       原文標題 : 國產(chǎn)GPU,要把算力搬到太空!

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號