ASIC的時(shí)代即將到來(lái)?
英偉達(dá)憑借GPU與CUDA生態(tài)構(gòu)筑的護(hù)城河,讓無(wú)數(shù)企業(yè)甘愿為高昂的硬件成本與毛利率買(mǎi)單。因?yàn)樵诩夹g(shù)探索期,算力供給的穩(wěn)定性遠(yuǎn)比性?xún)r(jià)比重要。
但當(dāng)AI應(yīng)用進(jìn)入規(guī);逃秒A段,那些曾對(duì)GPU價(jià)格無(wú)動(dòng)于衷的科技巨頭們,正悄然將目光投向更高效的定制化方案。正如比特幣挖礦從CPU到GPU再到ASIC的演進(jìn)軌跡,當(dāng)算法架構(gòu)逐漸固化,通用計(jì)算芯片的靈活性反而成為桎梏。
云端服務(wù)商對(duì)電費(fèi)的敏感度、企業(yè)級(jí)客戶(hù)對(duì)投資回報(bào)率的苛求,都在推動(dòng)一個(gè)共識(shí):在算力需求爆炸的今天,為特定場(chǎng)景定制的ASIC芯片,或許才是平衡性能與成本的最優(yōu)解。
01. 大模型算法或進(jìn)入瓶頸期
當(dāng)AI應(yīng)用進(jìn)入規(guī)模化商用階段,成本問(wèn)題逐漸凸顯:Grok3訓(xùn)練消耗約20萬(wàn)塊H100 GPU(成本約5.9億美元),ChatGPT5訓(xùn)練成本達(dá)5億美元,遠(yuǎn)超早期GPT3僅140萬(wàn)美元的投入。這種指數(shù)級(jí)增長(zhǎng)背后,是Transformer架構(gòu)的局限性:其二次復(fù)雜度Attention機(jī)制導(dǎo)致算力需求劇增,預(yù)訓(xùn)練紅利逐漸觸頂。
大模型的本質(zhì)仍是基于概率權(quán)重的統(tǒng)計(jì)模型,其"幻覺(jué)"與表現(xiàn)力的平衡始終是難題。從信息熵的角度看,早期能力提升依賴(lài)技術(shù)優(yōu)化,后期則受限于數(shù)據(jù)豐度——Grok3與GPT5的能力已接近當(dāng)前數(shù)據(jù)環(huán)境下的挖掘極限。盡管Transformer架構(gòu)下的能力天花板逐漸顯現(xiàn),但突破現(xiàn)有技術(shù)路線(xiàn)仍充滿(mǎn)不確定性:若新架構(gòu)的起跳標(biāo)準(zhǔn)需超越GPT5,行業(yè)準(zhǔn)入門(mén)檻將大幅提高,可能延緩技術(shù)迭代速度。
盡管如此,大模型在垂直領(lǐng)域的應(yīng)用價(jià)值已被驗(yàn)證。在音樂(lè)創(chuàng)作、代碼生成等場(chǎng)景中,其效率提升顯著,部分從業(yè)者已借此實(shí)現(xiàn)商業(yè)化。但所謂"統(tǒng)一大模型"的概念正被打破——行業(yè)應(yīng)用工具的定制化開(kāi)發(fā)或成主流。各行業(yè)龍頭企業(yè)更傾向于在現(xiàn)有工具中嵌入AI模塊,兼顧效率與系統(tǒng)兼容性;對(duì)創(chuàng)業(yè)團(tuán)隊(duì)而言,精準(zhǔn)識(shí)別細(xì)分需求并落地解決方案更為關(guān)鍵。例如音樂(lè)生成領(lǐng)域,僅掌握大模型技術(shù)遠(yuǎn)不夠,還需深度理解音樂(lè)特性;To C端則面臨收費(fèi)模式與流量入口的雙重挑戰(zhàn)——巨頭通過(guò)免費(fèi)策略控制入口,再以其他業(yè)務(wù)變現(xiàn),中小企業(yè)的突破點(diǎn)更可能集中在To B領(lǐng)域。
當(dāng)前,大模型能力已不再是行業(yè)落地的核心矛盾,如何將技術(shù)優(yōu)勢(shì)轉(zhuǎn)化為實(shí)際場(chǎng)景的應(yīng)用價(jià)值,才是決定未來(lái)格局的關(guān)鍵。
02. ASIC是最優(yōu)解?
如果把芯片世界比作一個(gè)工具箱,那么ASIC就是那個(gè)為特定任務(wù)量身打造的"專(zhuān)業(yè)工匠"。不同于GPU這個(gè)"全能選手"(既能挖礦又能跑AI),ASIC(專(zhuān)用集成電路)從設(shè)計(jì)之初就鎖定單一目標(biāo)——就像專(zhuān)門(mén)為擰螺絲設(shè)計(jì)的電動(dòng)起子,雖然只能擰螺絲,但效率是普通螺絲刀的百倍。
以比特幣挖礦為例,早期礦工用CPU計(jì)算,后來(lái)發(fā)現(xiàn)GPU并行計(jì)算能力更強(qiáng),但真正讓挖礦實(shí)現(xiàn)產(chǎn)業(yè)化的,是比特大陸推出的ASIC礦機(jī)。這種芯片把所有電路資源都用于執(zhí)行SHA256哈希算法,就像把整個(gè)芯片變成一臺(tái)"算力永動(dòng)機(jī)",單位能耗的挖礦效率是GPU的千倍級(jí)別。這種極致優(yōu)化帶來(lái)的結(jié)果是:當(dāng)比特幣網(wǎng)絡(luò)難度飆升時(shí),只有ASIC能保持經(jīng)濟(jì)可行性。
這種特性在AI領(lǐng)域同樣關(guān)鍵。英偉達(dá)GPU雖然能處理各種算法,但運(yùn)行Transformer架構(gòu)時(shí),大量晶體管被用于通用計(jì)算而非特定任務(wù)。就像用瑞士軍刀切菜,雖然能用但遠(yuǎn)不如專(zhuān)業(yè)菜刀高效。而ASIC可以把所有電路資源分配給矩陣乘法、激活函數(shù)等核心操作,理論上能實(shí)現(xiàn)10倍以上的能效比提升。
運(yùn)維成本的差異更直觀。一塊NVIDIA GPU功耗約700瓦,運(yùn)行大模型時(shí)每小時(shí)電費(fèi)約0.56元(按0.8元/度計(jì))。而同等算力的ASIC芯片功耗可控制在200瓦內(nèi),同樣任務(wù)每小時(shí)電費(fèi)僅0.16元。對(duì)于需要部署數(shù)萬(wàn)張卡的云服務(wù)商,這種差距每年可能節(jié)省數(shù)千萬(wàn)度電——相當(dāng)于一個(gè)小型電廠(chǎng)的年發(fā)電量。
不過(guò)ASIC的"專(zhuān)業(yè)病"也很明顯:一旦算法升級(jí)或任務(wù)變更,這些定制芯片就可能淪為"電子廢品"。就像專(zhuān)門(mén)為膠片相機(jī)設(shè)計(jì)的鏡頭,在數(shù)碼時(shí)代毫無(wú)用武之地。因此它更適合算法相對(duì)固化的場(chǎng)景,比如云端推理服務(wù)、自動(dòng)駕駛感知系統(tǒng)等需要長(zhǎng)期穩(wěn)定運(yùn)行的任務(wù)。
當(dāng)前AI產(chǎn)業(yè)正面臨關(guān)鍵轉(zhuǎn)折:當(dāng)大模型訓(xùn)練成本從GPT3時(shí)代的千萬(wàn)級(jí)飆升至Grok3的數(shù)十億美元級(jí),連科技巨頭也開(kāi)始重新評(píng)估技術(shù)路線(xiàn)。就像當(dāng)年從CPU轉(zhuǎn)向GPU一樣,現(xiàn)在或許輪到GPU讓位給更專(zhuān)業(yè)的ASIC。
03. 國(guó)內(nèi)設(shè)計(jì)服務(wù)廠(chǎng)商有望受益良多
定制加速計(jì)算芯片(ASIC)正成為AI算力革命的核心驅(qū)動(dòng)力。據(jù)預(yù)測(cè),2028年全球定制加速計(jì)算芯片市場(chǎng)規(guī)模將達(dá)429億美元,占加速芯片市場(chǎng)的25%,2023-2028年復(fù)合增長(zhǎng)率達(dá)45%。這一爆發(fā)式增長(zhǎng)源于AI模型對(duì)算力需求的指數(shù)級(jí)攀升:訓(xùn)練集群已從萬(wàn)卡級(jí)向十萬(wàn)卡級(jí)演進(jìn),而推理集群雖單集群規(guī)模較小,但百萬(wàn)級(jí)部署量將形成更龐大的市場(chǎng)需求。
科技巨頭正加速布局自研ASIC以搶占先機(jī)。谷歌推出第六代TPU Trillium芯片,重點(diǎn)優(yōu)化能效比,計(jì)劃2025年大規(guī)模替代TPU v5,并打破此前僅與博通合作的模式,新增聯(lián)發(fā)科形成雙供應(yīng)鏈,強(qiáng)化先進(jìn)制程布局。亞馬遜AWS以與Marvell聯(lián)合設(shè)計(jì)的Trainium v2為主力,同步開(kāi)發(fā)Trainium v3,TrendForce預(yù)測(cè)其2025年ASIC出貨量增速將居美系云服務(wù)商首位。Meta在首款自研推理芯片MTIA成功部署后,正與博通開(kāi)發(fā)下一代MTIA v2,聚焦能效與低延遲架構(gòu),適配高度定制化的推理負(fù)載需求。微軟雖仍依賴(lài)英偉達(dá)GPU,但自研Maia系列芯片已進(jìn)入迭代階段,Maia v2由GUC負(fù)責(zé)量產(chǎn),并引入Marvell參與進(jìn)階版設(shè)計(jì),分散技術(shù)與供應(yīng)鏈風(fēng)險(xiǎn)。
芯片設(shè)計(jì)廠(chǎng)商亦迎來(lái)增長(zhǎng)機(jī)遇。博通2025年第二季度AI半導(dǎo)體收入超44億美元,同比增長(zhǎng)46%,其定制AI加速器(XPU)業(yè)務(wù)受益于三家客戶(hù)百萬(wàn)級(jí)集群部署計(jì)劃,預(yù)計(jì)2026年下半年推理需求將加速釋放。Marvell主導(dǎo)的3nm XPU計(jì)劃已獲得先進(jìn)封裝產(chǎn)能,2026年啟動(dòng)生產(chǎn),并與第二家超大規(guī)?蛻(hù)展開(kāi)迭代合作。國(guó)內(nèi)市場(chǎng)同步加速,阿里巴巴平頭哥推出Hanguang 800推理芯片,百度集團(tuán)建成自研萬(wàn)卡集群(昆侖芯三代P800),騰訊控股通過(guò)自研Zixiao芯片與投資燧原科技形成組合方案。
這場(chǎng)變革的本質(zhì)是算力供給從通用走向?qū)I(yè)化的轉(zhuǎn)型。當(dāng)AI應(yīng)用進(jìn)入規(guī);涞仉A段,ASIC憑借針對(duì)特定算法的極致優(yōu)化能力,正在重新定義算力經(jīng)濟(jì)的成本結(jié)構(gòu)與技術(shù)路線(xiàn)。
- End -
原文標(biāo)題 : ASIC的時(shí)代即將到來(lái)?

發(fā)表評(píng)論
登錄
手機(jī)
驗(yàn)證碼
立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)
還不是會(huì)員?免費(fèi)注冊(cè)
忘記密碼請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
精彩回顧立即查看>> 【在線(xiàn)研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 【在線(xiàn)會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專(zhuān)題
- 1 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車(chē)出海美國(guó)
- 2 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 3 阿里首位程序員,“掃地僧”多隆已離職
- 4 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來(lái)新一輪協(xié)同進(jìn)化
- 5 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 6 六大國(guó)產(chǎn)大模型,誰(shuí)是最強(qiáng)“金融分析師”?|錦緞評(píng)測(cè)
- 7 2025年第一支10倍股,來(lái)了!
- 8 募資39.85億元!寒武紀(jì)押注大模型芯片與軟件平臺(tái)
- 9 國(guó)內(nèi)免費(fèi)版Deep Research上線(xiàn),秘塔AI深度研究嘗試重塑知識(shí)工作范式
- 10 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億