百模大戰(zhàn),誰是下一個(gè)ChatGPT?
03 AI熱“兩極化”,中間真空
大模型讓AI公司越來越重。
4月10日,商湯在公布“日日新SenseNova”大模型體系的同時(shí),其實(shí)還提到另一個(gè)關(guān)鍵點(diǎn),即依托于AI大裝置SenseCore實(shí)現(xiàn)“大模型+大算力”的研發(fā)體系。
為了滿足大模型海量數(shù)據(jù)訓(xùn)練的需求,原本可以輕裝上陣的算法公司,開始自己做云,也自建人工智能數(shù)據(jù)中心(AIDC)。
另一個(gè)案例就是毫末,這家自動(dòng)駕駛公司為了用大模型訓(xùn)練數(shù)據(jù),也建了自己的智算中心。
這些垂類的AI巨頭和獨(dú)角獸,之所以要自己做的這么重,最重要的原因之一,就是市面上幾乎沒有高性能的現(xiàn)成產(chǎn)品可以滿足。
近年來,大模型參數(shù)量以指數(shù)級(jí)的速率提升,而數(shù)據(jù)量隨著多模態(tài)的引入也將大規(guī)模增長,因此就必然會(huì)導(dǎo)致對(duì)算力需求的劇增。例如,過去5年,超大參數(shù)AI大模型的參數(shù)量幾乎每一年提升一個(gè)數(shù)量級(jí)。過往的10年,最好的AI算法對(duì)于算力的需求增長超過了100萬倍。
一位商湯員工表示,商湯上海臨港AIDC的服務(wù)器機(jī)柜設(shè)計(jì)功耗10千瓦~25千瓦,最大可同時(shí)容納4臺(tái)左右英偉達(dá)A100服務(wù)器,但普通的服務(wù)器機(jī)柜普遍設(shè)計(jì)功耗以5千瓦居多,而單臺(tái)A100服務(wù)器的功耗即高達(dá)4.5千瓦左右。
科技巨頭就更是如此,每個(gè)巨頭都希望在自己的生態(tài)中形成閉環(huán),一定程度上也是因?yàn)檎麄(gè)國內(nèi)開源的生態(tài)不夠強(qiáng)大。
目前,大模型產(chǎn)業(yè)鏈大致可以分為數(shù)據(jù)準(zhǔn)備、模型構(gòu)建、模型產(chǎn)品三個(gè)層次。在國外,AI大模型的產(chǎn)業(yè)鏈比較成熟,形成了數(shù)量眾多的AI Infra(架構(gòu))公司,但這一塊市場在國內(nèi)還相對(duì)空白。
而在國內(nèi),巨頭們都有一套自己的訓(xùn)練架構(gòu)。
比如,華為的模型采用的是三層架構(gòu),其底層屬于通識(shí)性大模型,具備超強(qiáng)的魯棒性的泛化性,在這之上是行業(yè)大模型和針對(duì)具體場景和工作流程的部署模型。這種構(gòu)架的好處是,當(dāng)訓(xùn)練好的大模型部署到垂類行業(yè)時(shí),可以不必再重復(fù)訓(xùn)練,成本僅是上一層的5%~7%。
阿里則是為AI打造了一個(gè)統(tǒng)一底座,無論是CV、NLP、還是文生圖大模型都可以放進(jìn)去這個(gè)統(tǒng)一底座中訓(xùn)練,阿里訓(xùn)練M6大模型需要的能耗僅是GPT-3的1%。
百度和騰訊也有相應(yīng)的布局,百度擁有覆蓋超50億實(shí)體的中文知識(shí)圖譜,騰訊的熱啟動(dòng)課程學(xué)習(xí)可以將萬億大模型的訓(xùn)練成本降低到冷啟動(dòng)的八分之一。
整體來看,各個(gè)大廠之間的側(cè)重點(diǎn)雖然有所不同,但主要特點(diǎn)就是降本增效,而能夠?qū)崿F(xiàn)這一點(diǎn),很大程度上就是受益于“一手包辦”的閉環(huán)訓(xùn)練體系。
這種模式在單一大廠內(nèi)部固然有優(yōu)勢,但從行業(yè)角度而言,也存在一些問題。
國外成熟的AI產(chǎn)業(yè)鏈形成了數(shù)量眾多的AI Infra公司,這些公司有的專門做數(shù)據(jù)標(biāo)注、做數(shù)據(jù)質(zhì)量、或者模型架構(gòu)等。
這些企業(yè)的專業(yè)性,能夠讓他們?cè)谀骋粋(gè)單一環(huán)節(jié)的效率、成本、質(zhì)量上都要比大廠親自下場做得更好。
比如,數(shù)據(jù)質(zhì)量公司Anomalo就是Google Cloud和Notion的供應(yīng)商,它可以通過ML自動(dòng)評(píng)估和通用化數(shù)據(jù)質(zhì)量檢測能力,來實(shí)現(xiàn)數(shù)據(jù)深度觀察和數(shù)據(jù)質(zhì)量檢測。
這些公司就像汽車行業(yè)的Tier 1,通過專業(yè)的分工,能夠讓大模型企業(yè)不必重復(fù)造輪子,而只需要通過整合供應(yīng)商資源,就能快速地搭建起自己模型構(gòu)架,從而降低成本。
但國內(nèi)在這一方面并不成熟,原因在于:一方面國內(nèi)大模型的主要玩家都是大廠,他們都有一套自己的訓(xùn)練體系,外部供應(yīng)商幾乎沒有機(jī)會(huì)進(jìn)入;另一方面,國內(nèi)也缺乏足夠龐大的創(chuàng)業(yè)生態(tài)和中小企業(yè),AI供應(yīng)商也很難在大廠之外找到生存的空間。
以谷歌為例,谷歌愿意將自己訓(xùn)練的數(shù)據(jù)結(jié)果分享給它的數(shù)據(jù)質(zhì)量供應(yīng)商,幫助供應(yīng)商提高數(shù)據(jù)處理能力,供應(yīng)商能力提升之后,又會(huì)反過來給谷歌提供更多高質(zhì)量數(shù)據(jù),從而形成一種良性循環(huán)。
國內(nèi)AI Infra生態(tài)的不足,直接導(dǎo)致的就是大模型創(chuàng)業(yè)門檻的拔高。
王慧文剛下場做光年之外的時(shí)候曾提出5000萬美金的投入,這筆錢其實(shí)是李志飛為他算的,具體可以分為2000萬美金搞算力,2000萬美金找人,1000萬美金做數(shù)據(jù)。這體現(xiàn)出一個(gè)直接的問題,如果將在中國做大模型比喻成吃上一頓熱乎飯,那必須從挖地、種菜開始。
目前,在AI 2.0的熱潮中,一個(gè)重要的特點(diǎn)就是“兩極化”:最熱門的要么是大模型層、要么就是應(yīng)用層。而類似AI Infra(架構(gòu))的中間層,反而有很大的真空。
別都盯著造輪子,能造一顆好的螺絲也很重要。
04 結(jié)語:巨頭&創(chuàng)新者
王小川和百度的隔空口水戰(zhàn),成為最近大模型混戰(zhàn)中一個(gè)熱鬧的插曲。
“高富帥”李彥宏認(rèn)為,中國基本不會(huì)再出OpenAI,用巨頭的就可以了。
“直男”王小川說,行業(yè)中有些人(李彥宏)對(duì)未來的觀點(diǎn)從來就沒有判斷對(duì)過,一直活在平行宇宙里。
除了陳年恩怨,這大體上可以看作是巨頭和創(chuàng)業(yè)者之間的立場對(duì)立:巨頭都喜歡包攬一切,而創(chuàng)業(yè)者則喜歡打破常規(guī)。
而科技行業(yè)的成功似乎更依仗于創(chuàng)新。畢竟,從打造AlophaGo的DeepMind,到發(fā)布ChatGPT的OpenAI,沒有一個(gè)是從巨頭中孵化出來的。
這就是創(chuàng)新者的窘境。
對(duì)于科技巨頭而言,自己造輪子固然重要,但能找到、孵化出下一個(gè)OpenAI又未嘗不可呢?
原文標(biāo)題 : 百模大戰(zhàn),誰是下一個(gè)ChatGPT?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國三十周年感恩回饋助力企業(yè)升級(jí)!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 9 蘋果把身家押在Siri上:一場輸不起的自我革命
- 10 共探合作新機(jī)遇!江門市新會(huì)區(qū)(深圳)“AI + 機(jī)器人” 產(chǎn)業(yè)對(duì)接會(huì)成功舉辦