字節(jié)跳動(dòng)大模型:實(shí)用,實(shí)用主義
作者丨陳江
來源丨零壹智庫
字節(jié)跳動(dòng)無疑是當(dāng)前互聯(lián)網(wǎng)平臺的流量之王,也是媒體眼中的實(shí)用主義者。在當(dāng)紅的大模型賽道上,流量手段和實(shí)用路徑依然體現(xiàn)得淋漓盡致。
01
“算法”基因
其實(shí),字節(jié)挑動(dòng)在AI方面的布局、應(yīng)用的時(shí)間可能遠(yuǎn)早于一眾大廠。2012年剛成立的時(shí)候,字節(jié)推出基于智能推薦算法的產(chǎn)品“今日頭條”APP,成為國內(nèi)最早將人工智能技術(shù)運(yùn)用到移動(dòng)應(yīng)用場景的科技公司之一。
2016年,字節(jié)跳動(dòng)更進(jìn)一步,成立人工智能實(shí)驗(yàn)室,開始針對AI技術(shù)進(jìn)行系統(tǒng)性的研發(fā)與儲備。2019年,字節(jié)收購了英國一家利用人工智能創(chuàng)作音樂的公司Jukedeck,后者創(chuàng)始人&CEO埃德·牛頓-里克斯(Ed Newton-Rex)隨后加盟字節(jié)跳動(dòng)并擔(dān)任人工智能實(shí)驗(yàn)室主任。
2020年之后,字節(jié)又將AI技術(shù)廣泛應(yīng)用在抖音、今日頭條等APP上,推出繪畫、特效類等AIGC功能,同時(shí)也積極探索大模型應(yīng)用場景,比如抖音AI繪圖、飛書智能伙伴、剪影AI生成視頻等。
除了自己發(fā)力研發(fā)外,字節(jié)跳動(dòng)還對外做了大量的人工智能相關(guān)投資。
據(jù)零壹智庫梳理統(tǒng)計(jì),截至目前,字節(jié)在人工智能領(lǐng)域出手投資達(dá)到26次(含并購),其中行業(yè)應(yīng)用層面19次,占比73.1%。
在大模型方面,字節(jié)比百度等大廠略晚,2023年8月,宣布云雀大模型上線,但也趕上了備案頭班車,成為國內(nèi)首批算法備案的大模型之一。這亦是“豆包”等一些列應(yīng)用產(chǎn)品的技術(shù)支撐與底座。上線后,該大模型每天平均處理的token數(shù)量高達(dá)1200億,相當(dāng)于1800億的漢字或生成3000萬張圖片。
02
全家桶
今年5月15日,2024春季火山引擎FORCE原動(dòng)力大會在北京舉行。會上,字節(jié)跳動(dòng)旗下火山引擎正式全員亮相了豆包大模型。這是一個(gè)模型大家族,包括通用模型pro、通用模型lite、語音識別模型、語音合成模型、文生圖模型等9款產(chǎn)品。
而此時(shí),豆包在流量上已經(jīng)以迅雷之勢站上舞臺中央。
據(jù)原動(dòng)力大會發(fā)布的數(shù)據(jù)顯示,豆包在蘋果APP Store和各大安卓應(yīng)用市場的下載量突破1億,在AIGC類應(yīng)用中排名第一,月度活躍用戶突破2600萬,智能體創(chuàng)建總數(shù)達(dá)800萬。
To B方面,火山引擎于2023年6月上線了MaaS平臺,即火山方舟。這個(gè)平臺匯集了國內(nèi)科技公司和科研院所的優(yōu)秀模型(比如百川智能、復(fù)旦大學(xué)MOSS等),有點(diǎn)類似打造大模型領(lǐng)域的電商平臺模式,幫助企業(yè)為不同場景選擇合適的模型,同時(shí)提供充沛算力、安全互信等方面的支持。
火山方舟發(fā)布后,公司與汽車、手機(jī)、金融、食品飲料等領(lǐng)域的龍頭企業(yè)展開了密切合作,包括吉利汽車、長城汽車、OPPO、vivo、小米、華碩、招商銀行、海底撈等。
不管是面向個(gè)人消費(fèi)者的C端,亦或是面向廣大產(chǎn)業(yè)的B端,字節(jié)均是有了相當(dāng)?shù)挠脩艋鶖?shù)之后,再做大模型的全面發(fā)布。這種戰(zhàn)略與其他絕大多數(shù)玩家是不一樣的,后者往往是將大模型和應(yīng)用產(chǎn)品一同發(fā)布,再去開拓市場。
本次字節(jié)全員亮相的豆包大模型(前身即云雀),涵蓋了文本對話、語音識別與合成、聲音復(fù)刻、角色扮演、文生圖等基礎(chǔ)功能與產(chǎn)品,并進(jìn)行了多方面的升級。其應(yīng)用場景非常廣泛,包括但不限于辦公智能助手、電商導(dǎo)購、營銷創(chuàng)作、編程助手等50余個(gè)業(yè)務(wù)場景。
針對B端,火山方舟已升級到2.0,可以讓企業(yè)更加高效、簡易地實(shí)現(xiàn)AI創(chuàng)新和應(yīng)用落地,同時(shí)降低企業(yè)使用大模型的成本和技術(shù)門檻。應(yīng)用場景包括智能外呼、數(shù)字人、數(shù)據(jù)助理等等。
03
價(jià)格戰(zhàn)
為了搶占企業(yè)用戶市場份額,字節(jié)大模型大打價(jià)格戰(zhàn)。其中,豆包主力模型在企業(yè)市場的定價(jià)為0.00008元/千 Tokens,比行業(yè)價(jià)格降低了99.3%。
圖1:大模型定價(jià)對比(單位:元/千Tokens)
數(shù)據(jù)來源:火山引擎FORCE原動(dòng)力大會,零壹智庫
對于大降價(jià)原因,火山引擎總裁譚待在接受媒體采訪時(shí)表示,一方面,字節(jié)跳動(dòng)在在模型結(jié)構(gòu)、訓(xùn)練、生產(chǎn)等各種技術(shù)層面都能做到很好,有很多優(yōu)化手段能夠?qū)崿F(xiàn)降價(jià)。此外,市場對降價(jià)呼聲比較大,平臺必須把試錯(cuò)成本做到非常低,才能讓大家用起來。
另一方面,用戶規(guī)模的擴(kuò)大也將提升大模型的性能。大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。
B端企業(yè)市場是大模型廠商的兵家必爭之地,因?yàn)榭梢蕴峁└苯、且可以預(yù)測的現(xiàn)金流收入。而C端要落地到具體應(yīng)用中,需要很長的時(shí)間來開發(fā)市場、教育用戶,并且如何盈利一切都是未知數(shù)。
百度的文心一言、阿里的通義千問服務(wù)的企業(yè)客戶眾多,分別高達(dá)8.5萬家、9萬家,市場占有率相對更高一些。
豆包大模型價(jià)格大降,亦是想通過價(jià)格戰(zhàn)與百度、阿里正面PK,搶奪更多的企業(yè)用戶。
面對字節(jié)的打骨折,阿里宣布跟進(jìn)大降價(jià),將通義千問GPT-4級別的主力模型Qwen-Long的API輸入價(jià)格,從每千個(gè)token的0.02元降至0.0005元,比字節(jié)還低0.0003元。
04
砸廣告
在C端市場,字節(jié)跳動(dòng)亦是高舉高打。
據(jù)Quest Mobile數(shù)據(jù)顯示,2024年1月,豆包APP在人工智能生成內(nèi)容(AIGC)APP活躍用戶排行榜中排名第一。到了3月,月活用戶量亦是文心一言的1.5倍。
即便如此,豆包依然不滿足,將重心放在如何搞流量上。
用戶活躍數(shù)、訪問使用量等核心經(jīng)營指標(biāo)是C端大模型廠商能否活下去,或者說未來能夠?qū)崿F(xiàn)商業(yè)化的核心基礎(chǔ)。包括豆包在內(nèi)的大模型廠商掀起了燒錢大戰(zhàn),買用戶。
據(jù)AppGrowing統(tǒng)計(jì),2024年6月第一周(6/3-6/9),豆包素材投放量高達(dá)26521個(gè),環(huán)比增長38.6%。相對而言,Kimi為14451個(gè),環(huán)比增長160.7%;智譜清言為1866個(gè),環(huán)比飆升2456%。
線上渠道方面,大廠們主要聚焦在吸納了眾多年輕人的B站社區(qū)上,6月第一周AI廣告投放量是去年同期的3-4倍。
除B站外,線上推廣渠道進(jìn)一步擴(kuò)散至小紅書、抖音等平臺。比如,在抖音平臺上,單個(gè)AI相關(guān)詞條下,豆包硬廣、軟廣外,還有頭部達(dá)人帶貨。在小紅書上,合作KOL發(fā)布體驗(yàn)視頻、利用話題標(biāo)簽增加曝光、舉辦互動(dòng)問答和抽獎(jiǎng)活動(dòng)等方式進(jìn)行推廣。
線下渠道方面,一二線主要城市的寫字樓、地鐵、機(jī)場等白領(lǐng)聚集的場所,都成為推廣的重要戰(zhàn)場。
僅僅在6月上旬,豆包廣告投放金額就已經(jīng)高達(dá)1.24億元,令眾多大廠有些望塵莫及。
05
犯忌諱
此外,為了流量,豆包大模型劍走偏鋒,甚至“不擇手段”。
今年5月底,據(jù)一些網(wǎng)友爆料,百度和谷歌的搜索結(jié)果中,除了廣告之外,第一頁全部來自豆包生成的內(nèi)容。在谷歌搜索引擎里更是生成超過2000萬條各式各類的詞條內(nèi)容并進(jìn)行固化。
這些內(nèi)容也會關(guān)聯(lián)搜索引擎高點(diǎn)擊率的關(guān)鍵詞,從而獲取訪問流量,或者被其他大模型抓取并使用,以達(dá)到推廣豆包之目的。
豆包的做法,也并不難理解。簡單來說,通過數(shù)據(jù)進(jìn)行訓(xùn)練,訓(xùn)練好后對人類的原創(chuàng)內(nèi)容進(jìn)行“洗稿”,再將之作為“全新原創(chuàng)”內(nèi)容,并通過算法進(jìn)行大量分發(fā),進(jìn)入到搜索引擎數(shù)據(jù)庫中。
去年的一篇論文——《遞歸的詛咒:在生成數(shù)據(jù)上訓(xùn)練會使模型遺忘》就詳細(xì)講解了當(dāng)模型使用生成的數(shù)據(jù)進(jìn)行訓(xùn)練時(shí),生成數(shù)據(jù)如何污染下一代模型的訓(xùn)練集,導(dǎo)致模型逐漸失去對原始數(shù)據(jù)的正確感知,出現(xiàn)模型崩潰現(xiàn)象。
很快,豆包的做法引發(fā)了社會輿情的反彈以及其他AI大模型廠商的警覺。一方面,豆包自己進(jìn)行了整改與優(yōu)化。另一方面,谷歌下架了所有豆包的詞條內(nèi)容。此外,國內(nèi)各大互聯(lián)網(wǎng)公司也針對AI生成的詞條以及低質(zhì)量的語料修改了算法。
原文標(biāo)題 : 字節(jié)跳動(dòng)大模型:實(shí)用,實(shí)用主義

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會深圳站
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
精彩回顧立即查看>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 【在線會議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 2 黃仁勛:與雷軍長期合作,共探AI智駕
- 3 阿里首位程序員,“掃地僧”多隆已離職
- 4 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進(jìn)化
- 5 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 6 六大國產(chǎn)大模型,誰是最強(qiáng)“金融分析師”?|錦緞評測
- 7 2025年第一支10倍股,來了!
- 8 募資39.85億元!寒武紀(jì)押注大模型芯片與軟件平臺
- 9 國內(nèi)免費(fèi)版Deep Research上線,秘塔AI深度研究嘗試重塑知識工作范式
- 10 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億