文心一言,一言難盡
趕鴨子上架的“百度”
ChatGPT以火箭般的速度爆紅,沉靜許久的中國(guó)科技圈和創(chuàng)投界的終于再次引發(fā)熱潮;ヂ(lián)網(wǎng)大佬王慧文自掏腰包、帶資建組,科技大廠摩拳擦掌、爭(zhēng)先恐后,創(chuàng)業(yè)公司也不遑多讓,甚至跟AI不搭邊的個(gè)別企業(yè)也借勢(shì)營(yíng)銷,并因此而收獲一波股價(jià)的大漲。
但真正下場(chǎng)目前要發(fā)布產(chǎn)品就只有百度了。以AI技術(shù)見(jiàn)長(zhǎng),號(hào)稱過(guò)去10年在AI領(lǐng)域投入超過(guò)1100億元研發(fā)費(fèi)用的百度,自然成為被關(guān)注的對(duì)象。是騾子是馬總要拉出來(lái)溜溜才行。
但巧合的是,OpenAI于3月15日發(fā)布GPT-4瞬間火爆全網(wǎng),但已經(jīng)定下3月16日發(fā)布的百度總不能推遲日子,說(shuō)好的對(duì)標(biāo)ChatGPT呢?
但想象中的百度版ChatGPT沒(méi)來(lái),“ChatPPT”倒是來(lái)了。發(fā)布會(huì)的演示最重點(diǎn)的就是實(shí)際使用的演示,從喬布斯的年代開(kāi)始都是如此。老羅的李姐萬(wàn)歲言猶在耳。百度這次選擇了全錄制,很難不讓人聯(lián)想到是擔(dān)心出現(xiàn)老羅一樣的事故,也就代表著有很強(qiáng)烈的不自信;當(dāng)然也可能是被 Google 演示的小錯(cuò)誤事故嚇怕了。
發(fā)布會(huì)現(xiàn)場(chǎng),李彥宏用提前錄制好的視頻展示了文心一言的文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成等五方面功能。在錄制好的視頻里,文心一言幫劉慈欣續(xù)寫(xiě)了《三體》,介紹了洛陽(yáng)紙貴背后的經(jīng)濟(jì)學(xué)原理,算了雞兔同籠數(shù)學(xué)題,根據(jù)指令生成了海報(bào)和一段宣傳視頻。
但是明顯進(jìn)步的GPT-4在昨天已經(jīng)拉高了群眾期待,你百度遮遮掩掩拿一個(gè)半成品算怎么回事呢?資本市場(chǎng)可不管你什么網(wǎng)絡(luò)原因,先跑為敬所以百度發(fā)布會(huì)當(dāng)天一度跌停。
百度這次發(fā)布會(huì),有著很明顯是背著很重的銷售 KPI 包袱的,在聊后面的部分,都是 toB 銷售的話術(shù),講技術(shù)的抽象概念和商業(yè)合作的價(jià)值。這就跟OpenAI大篇幅講產(chǎn)品形成了鮮明對(duì)比,觀感不好還是其次,沒(méi)講好產(chǎn)品那就是加負(fù)分了。
錄播的文心一言就一定不行嗎
根據(jù)多家媒體對(duì)文心一言的試用綜合來(lái)看,與預(yù)期相比,百度文心一言還是能夠及格的。雖然與搭載 Chat GPT 的 Bing 稍微有一些差距,但差距不是特別大,在中文常識(shí)上,文心一言是強(qiáng)于 Bing 的,但在英文內(nèi)容和邏輯推理上是弱于Bing。
對(duì)于“文心一言”的產(chǎn)品表現(xiàn),百度創(chuàng)始人李彥宏略顯底氣不足,在發(fā)布會(huì)剛出場(chǎng)不久,就開(kāi)始主動(dòng)降低用戶預(yù)期。他說(shuō)道,“要對(duì)標(biāo) ChatGPT、甚至 GPT-4,門檻還是很高的”、“自己測(cè)試還是感覺(jué)有很多不完美的地方”。
文心一言確實(shí)還不如ChatGPT,但總要客觀認(rèn)識(shí)到我們今天所說(shuō)的 ChatGPT,或者其背后的 GPT-4 語(yǔ)言模型,是一個(gè)花了 5 年時(shí)間、經(jīng)歷了 4 次迭代,完成了從量變到質(zhì)變過(guò)程。想讓文心一言在幾個(gè)月這么短的時(shí)間內(nèi)實(shí)現(xiàn)趕超,幾乎是不可能的事情。
不過(guò)就目前而言有大語(yǔ)言模型可用比好不好用更重要,只要基本框架打好后面就只需要堆疊豐富的語(yǔ)料和模型校正,好用起來(lái)那只是時(shí)間問(wèn)題。在筆者看來(lái)雖然目前已經(jīng)聲稱要做中國(guó)版Chat GPT的很多,比如騰訊的混元AI大模型、京東的Chat JD等等,但真正在AI在內(nèi)容上有長(zhǎng)期大投入還是百度,如果百度都做不出來(lái)其他家希望就不大了。
目前來(lái)看文心一言不至于讓用戶很失望,更何況谷歌聲勢(shì)浩大的Bard不一樣不盡人意。拿這點(diǎn)批評(píng)中美科技差距過(guò)大是有點(diǎn)過(guò)了。
做大模型,前提是有資金的投入。OpenAI 在 2019 年獲得微軟 10 億美金的投入后,又于今年獲得了微軟 100 億美金的投資,這讓其有了燒錢的資本。業(yè)界測(cè)算, GPT-3 涉及 1750 億參數(shù),訓(xùn)練費(fèi)用約花費(fèi) 1200 萬(wàn)美元。據(jù)國(guó)盛證券報(bào)告估算, GPT-3 訓(xùn)練一次成本約為 140 萬(wàn)美元,每一次訓(xùn)練任務(wù)都耗資巨大。
此外,大模型訓(xùn)練的三要素包括大算力、大數(shù)據(jù)和大模型。有從業(yè)者指出,影響最后訓(xùn)練結(jié)果的因素有很多,包括清洗、標(biāo)注、模型結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練推理的技術(shù)積累等。每一個(gè)因素的變化都影響著最后的結(jié)果。
過(guò)去十幾年里百度一直在 AI 方面投入,包括 2019 年推出文心大語(yǔ)言模型。2022 年百度核心研發(fā)費(fèi)用達(dá)到 214.16 億元,占百度核心收入比例達(dá) 22.4%。但是,百度和 OpenAI 還有不小差距。李彥宏也直言,無(wú)論是哪家公司,都不可能靠突擊幾個(gè)月就能做出這樣的大語(yǔ)言模型。因?yàn)樯疃葘W(xué)習(xí)、自然語(yǔ)言處理,需要多年的堅(jiān)持和積累,沒(méi)法速成。
百度想要做什么
在國(guó)內(nèi)一級(jí)市場(chǎng)上,投資機(jī)構(gòu)為了投大模型公司,焦慮難安,行業(yè)幾乎每天都會(huì)有大量認(rèn)知的迭代。與之相應(yīng)的是創(chuàng)業(yè)熱潮,前美團(tuán)聯(lián)合創(chuàng)始人王慧文、出門問(wèn)問(wèn) CEO 李志飛、前搜狗 CEO 王小川、前京東高級(jí)副總裁周伯文等一批大佬,都在殺向大模型賽道。國(guó)內(nèi)大廠們更是如此。除了百度之外,阿里、騰訊、華為、字節(jié)、科大訊飛、商湯都沒(méi)有放棄大模型之戰(zhàn)。大模型耗資巨大不是模型問(wèn)題,“這是我的問(wèn)題”,一些從業(yè)者這樣回答,也彰顯了他們急切想要在大模型領(lǐng)域做出一番成績(jī)。
對(duì)于百度來(lái)說(shuō)這更是生死之戰(zhàn),百度的營(yíng)收結(jié)構(gòu)中廣告是大頭,而廣告又是極其依賴搜索的,如果搜索未來(lái)被GPT顛覆,那么百度就死無(wú)葬身之地了。
2022年全年,百度的營(yíng)收和凈利潤(rùn)均下滑。2022年,百度實(shí)現(xiàn)營(yíng)收1236.75億元,同比下滑0.66%;歸母凈利潤(rùn)75.59億元,同比下滑23.46%。
百度搜索引擎的市場(chǎng)份額已經(jīng)在加速下滑。市場(chǎng)調(diào)研機(jī)構(gòu)StatCounter數(shù)據(jù)顯示,從2022年1月至2023年1月,百度搜索引擎市場(chǎng)份額已經(jīng)從84.36%下降至65.21%。2022年全年,百度的廣告收入在每一個(gè)季度均出現(xiàn)同比下滑。數(shù)據(jù)顯示,百度2022年第一季度廣告收入同比下滑3.6%、第二季度為10%、第三季度為4%、第四季度為5.2%。如果All in AI不能成為新的增長(zhǎng)曲線,百度恐怕連二線大廠的地位都難以守住。
目前來(lái)看,百度做大模型并不是毫無(wú)優(yōu)勢(shì),技術(shù)面上,百度在中文NLP領(lǐng)域,無(wú)疑擁有先天優(yōu)勢(shì)。首先是對(duì)國(guó)內(nèi)技術(shù)政策的熟悉,令它比ChatGPT 更能滿足國(guó)內(nèi)市場(chǎng)需求。其次,作為最大的中文搜索引擎,百度擁有的高質(zhì)量數(shù)據(jù)集及中文數(shù)據(jù)收集能力,其他家難以比擬。
如果文心一言能夠成功,國(guó)內(nèi)流量是可以重新洗牌的。在國(guó)內(nèi),百度搜索入口的流量長(zhǎng)時(shí)間被移動(dòng)互聯(lián)網(wǎng)其他流量怪獸一點(diǎn)點(diǎn)分流,而如今除了百度的移動(dòng)生態(tài),大的流量入口基本都掐在騰訊系(微信、QQ)、阿里系(支付寶、淘系)、字節(jié)系(抖音)手上;文心一言給了百度一個(gè)機(jī)會(huì),但凡能有ChatGPT級(jí)別的表演,就有可能重新奪回流量。而生成式內(nèi)容也會(huì)豐富內(nèi)容生態(tài)與供給,讓百度的搜索業(yè)務(wù),重新有其他可能性。
文心一言是百度搜索引擎實(shí)現(xiàn)“模糊搜索”到“精準(zhǔn)推送”跨越的關(guān)鍵。生成式AI問(wèn)世之前,搜索引擎以“模糊搜索”為主,用戶需要根據(jù)在搜索引擎中打入關(guān)鍵字找到需要的內(nèi)容或鏈接,而通過(guò)文心一言,用戶可以通過(guò)自然語(yǔ)言交互的方式輕松獲得需要的內(nèi)容或鏈接,且內(nèi)容較為精準(zhǔn),即“精準(zhǔn)推送”。與此同時(shí),生成式內(nèi)容也會(huì)極大豐富內(nèi)容生態(tài)和內(nèi)容供給,讓成熟的搜索業(yè)務(wù)和搜索體驗(yàn)煥發(fā)生機(jī)。相比抖音短視頻長(zhǎng)時(shí)間大量試錯(cuò)來(lái)做精準(zhǔn)營(yíng)銷,Chat GPT類的精準(zhǔn)搜索無(wú)疑將會(huì)降低大量成本,這對(duì)廣告商來(lái)說(shuō)非常具有吸引力。當(dāng)然,百度還要想清楚如何讓用戶接收到真正有價(jià)值的信息,而不僅僅是廣告信息,避免再次出現(xiàn)目前搜索引擎廣告業(yè)務(wù)的尷尬。
還有更重要的一點(diǎn),文心一言的出現(xiàn)會(huì)加速百度通過(guò)人工智能技術(shù)賦能其他產(chǎn)業(yè),從技術(shù)本身,基于百度文心大模型已經(jīng)產(chǎn)生了多款面向 C 端的單點(diǎn)產(chǎn)品,例如產(chǎn)業(yè)級(jí)搜索系統(tǒng)“文心百中”。
寫(xiě)在最后
有投資人講中國(guó)要做Chat GPT要邁過(guò)三座大山,第一是資金山,微軟近些年共投入100億美元,國(guó)內(nèi)要做至少也要10億美元起步,這點(diǎn)對(duì)國(guó)內(nèi)大廠并不是特別困難。第二是工具限制芯片禁售難題,運(yùn)行AI大模型需要大量GPU芯片——芯片上受的鉗制,又影響了做AI大模型。要想跑通一次100億以上參數(shù)量的模型,至少要做到“千卡/月”這個(gè)級(jí)別,即:用1000張GPU卡,然后訓(xùn)練一個(gè)月。
即使不用最先進(jìn)的英偉達(dá)A100,按照一張GPU五萬(wàn)元的均價(jià)計(jì)算,1000張GPU意味著單月5000萬(wàn)的算力成本,這還沒(méi)算上算法工程師的工資。百度目前來(lái)看并沒(méi)有受到這個(gè)問(wèn)題困擾,不知道是通過(guò)什么替代方案解決的。
第三是AI人才尤其是NLP領(lǐng)域的人才,國(guó)內(nèi)目前還是非常匱乏的,如今世界局勢(shì)、國(guó)內(nèi)財(cái)務(wù)自由前景都截然不同,如何讓人才“系統(tǒng)性回國(guó)”成為非常大的挑戰(zhàn)。這點(diǎn)國(guó)內(nèi)大廠要多動(dòng)點(diǎn)腦筋不要遇事不決一直加薪。
所以想要做大模型做Chat GPT一定要想清楚,不要像元宇宙一樣風(fēng)口過(guò)后一地炮灰。
相比大多數(shù)企業(yè)都在關(guān)注GPT在語(yǔ)言上應(yīng)用,任正非則更關(guān)注對(duì)工業(yè)社會(huì)和農(nóng)業(yè)社會(huì)的促進(jìn),認(rèn)為未來(lái)98%的機(jī)會(huì)在這兩方面。ChatGPT對(duì)我們的機(jī)會(huì)是什么?它會(huì)把計(jì)算撐大,把管道流量撐大,這樣我們的產(chǎn)品就有市場(chǎng)需求。
任正非的話還是有一定道理的,工業(yè)對(duì)于AI的需求還是容易實(shí)現(xiàn)的強(qiáng)需求,對(duì)于眼下提升效率是實(shí)實(shí)在在可見(jiàn)的。變革的時(shí)代已經(jīng)來(lái)臨,創(chuàng)新已經(jīng)不是可選項(xiàng)而是必選項(xiàng)。
參考資料:
究竟是ChatGPT還是ChatPPT? 來(lái)源:全天候科技
百度“文心一言”就這?來(lái)源:深燃
李彥宏,有一點(diǎn)急 來(lái)源:商業(yè)人物
百度趕鴨子上架 來(lái)源:鹽財(cái)經(jīng)
百度步谷歌后塵 來(lái)源:甲子光年
文心一言發(fā)布我們拿到內(nèi)測(cè)賬號(hào)試了試 來(lái)源:知危
為什么會(huì)對(duì)文心一言發(fā)布會(huì)失望 來(lái)源:劉言飛語(yǔ)
ChatGPT真的是全村人的希望嗎 來(lái)源:美股研究社
原文標(biāo)題 : 文心一言,一言難盡

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫(huà)了十年的餅
- 7 張勇等人退出阿里合伙人
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)
- 10 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市