剛剛,70億獨(dú)角獸被“打假”
AI行業(yè)真的要注意下形象:不要過(guò)度PR,更不要撒謊。守衛(wèi)真實(shí),創(chuàng)業(yè)者人人有責(zé)。這是整體建議,不針對(duì)單個(gè)公司。
作者丨鉛筆道 直八
11月14日,一位融資4輪的AI創(chuàng)業(yè)者向鉛筆道透露:11月6日,看到零一萬(wàn)物發(fā)布Yi系列大模型,問(wèn)鼎多項(xiàng)世界第一,內(nèi)心很興奮。
零一萬(wàn)物由李開(kāi)復(fù)(創(chuàng)新工場(chǎng)創(chuàng)始人)創(chuàng)辦,成立于2023年5月16日,僅耗費(fèi)6個(gè)月,就研發(fā)出“世界最強(qiáng)”大模型,估值超10億美元(破70億元)。
據(jù)“零一萬(wàn)物”官方公眾號(hào)稱,據(jù)大模型社區(qū)Hugging Face評(píng)測(cè),Yi成為全球開(kāi)源大模型“雙料冠軍”,是迄今為止唯一登頂該社區(qū)全球開(kāi)源模型排行榜的國(guó)產(chǎn)模型。
文章稱,厚積薄發(fā)的成績(jī)仰賴于自研的“規(guī);(xùn)練試驗(yàn)平臺(tái)”和超強(qiáng)AI infra(基礎(chǔ)設(shè)施)能力。
據(jù)零一萬(wàn)物官方公眾號(hào)稱,Yi已躋身世界范圍內(nèi)開(kāi)源最強(qiáng)基礎(chǔ)模型之列
新模型出現(xiàn)后,引發(fā)了部分應(yīng)用類(lèi)公司關(guān)注,他們要著手測(cè)試:該大模型能否賦能自家產(chǎn)品。
但經(jīng)過(guò)一周測(cè)試后,這位AI創(chuàng)業(yè)者顯得比較失望。“測(cè)試結(jié)果一言難盡。PR做得太好,把我唬住了,沒(méi)細(xì)看就讓技術(shù)測(cè)試,傻乎乎的。有些耽誤我們的時(shí)間。”
關(guān)于具體原因,他稱:“不算自研模型,用的是別人的神經(jīng)網(wǎng)絡(luò)框架。”
他推測(cè),所謂的“Yi”系列大模型,可能是借用別人的框架做了些自己的訓(xùn)練,喂了不同的語(yǔ)料進(jìn)去——更像應(yīng)用工程師做的事情。“滿足適當(dāng)條件后,我們團(tuán)隊(duì)也能做。”
其實(shí),這件事在前一晚就傳開(kāi)了。
一封郵件顯示,“Yi”系列模型被提交至Hugging Face后,后者回復(fù)道:據(jù)我們了解,除了兩個(gè)張量被重命名外,Yi完全使用LLama架構(gòu)。
“張量”是一種核心數(shù)據(jù)結(jié)構(gòu),而LLaMA與GPT一樣,都是AIGC的主流基礎(chǔ)模型。
Hugging Face稱:后續(xù)會(huì)重新發(fā)布Yi,并重新命名張量(把名字改回來(lái))。
原阿里首席AI科學(xué)家賈揚(yáng)清也發(fā)布了一條朋友圈,大約意思是:“上周,有某海外客戶要我們幫他們適配某國(guó)內(nèi)大廠新模型,我們太忙,暫時(shí)還沒(méi)做。今天有朋友說(shuō),這個(gè)新模型實(shí)際就是LLaMA,但為了表示不一樣,把代碼里的名字(LLaMA)換成了自己的名字。
最后他給出建議:如果就是開(kāi)源的模型結(jié)構(gòu),建議就叫原來(lái)的名字,免得大家還要做一堆工作,就為了適配你們改名字。
以上信息,賈揚(yáng)清并沒(méi)有點(diǎn)名道姓,但事實(shí)細(xì)節(jié)與Yi確有諸多相似之處。
事發(fā)之后,AI從業(yè)者褒貶不一。
一位AI創(chuàng)業(yè)者張化(化名)表示:“部分價(jià)值值得肯定。Yi雖借用了別人的框架,但從0開(kāi)始做了訓(xùn)練。只是換名字確實(shí)沒(méi)必要。”
另一位AI創(chuàng)業(yè)者王佳(化名)稱:“類(lèi)似套殼也合理,這么短時(shí)間要做出世界最強(qiáng)模型,估計(jì)都得這么干,是正確做法,可以大大方方說(shuō)出來(lái),但套殼冒充原創(chuàng)做得不對(duì),再多人認(rèn)可也不對(duì)。”
AI創(chuàng)業(yè)者張方(化名)稱:“改名有可能是程序員的鍋,并非公司有意為之。”
其實(shí),這件事的細(xì)枝末節(jié)并不重要,重要的是,它給了AI產(chǎn)業(yè)敲響一記警鐘:凡AI參與者,應(yīng)該把實(shí)事求是放在重要位置。
過(guò)度PR容易勞民傷財(cái),實(shí)際收效甚微。
作為AI生態(tài)的老大哥,一旦有新模型出現(xiàn),便是牽一發(fā)而動(dòng)全身:開(kāi)源社區(qū)、下游應(yīng)用企業(yè)都會(huì)跟進(jìn),著手測(cè)試、適配。
如果經(jīng)過(guò)1-2周測(cè)試后,發(fā)現(xiàn)模型只是新瓶裝舊酒,反而徒耗精力。
“Yi其實(shí)做的是偏應(yīng)用的工作,基礎(chǔ)大模型確實(shí)不需要那么多人研發(fā)。我生氣的核心原因是:他耽誤了研發(fā)同事的時(shí)間。”
自研就是自研,非自研就是非自研,本沒(méi)有貴賤之分。
據(jù)科技部報(bào)告稱,中國(guó)研發(fā)的大模型數(shù)量全球第二,10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè)。這里的“大模型”并非全指“自研大模型”,也包含許多類(lèi)似Yi的非自研模型。
鉛筆道此前曾有報(bào)道,自研大模型難度很大,單次訓(xùn)練成本高達(dá)100萬(wàn)美元。而結(jié)合GPT的自研歷程,一個(gè)脫穎而出的世界最強(qiáng)模型,至少需要7年以上。
國(guó)內(nèi)的AI產(chǎn)業(yè)還是跟風(fēng)太嚴(yán)重。
2022年11月前ChatGPT沒(méi)火的時(shí)候,只有極少數(shù)公司專注大模型,比如清華大學(xué)智源研究院。2022年11月后,很多AI公司就一擁而上,爭(zhēng)先要做國(guó)產(chǎn)大模型。
也就是不到10個(gè)月的時(shí)間里,一批企業(yè)紛紛宣布推出大模型,并且各自宣稱其領(lǐng)先性。“幾個(gè)月就自研大模型”這種荒謬事,竟然在國(guó)內(nèi)AI產(chǎn)業(yè)風(fēng)起云涌,并有前赴后繼之勢(shì)。
鉛筆道對(duì)此現(xiàn)象嗤之以鼻。
AI創(chuàng)業(yè)者張方(化名)表示,國(guó)內(nèi)真正的自研大模型很少,根據(jù)他的測(cè)試結(jié)果,只有GLM(智譜AI發(fā)布)、BAT(百度/阿里/騰訊)、百川(搜狗創(chuàng)始人王小川研發(fā))等符合。
創(chuàng)新創(chuàng)業(yè)應(yīng)堅(jiān)守“實(shí)事求是”文化,守護(hù)真實(shí),人人有責(zé)。
原文標(biāo)題 : 剛剛,70億獨(dú)角獸被“打假”

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫(huà)了十年的餅
- 7 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 張勇等人退出阿里合伙人
- 10 深圳跑出40億超級(jí)隱形冠軍:賣(mài)機(jī)器人年入6.1億,港股上市