中文精品久久久久人妻51,亚洲永久精品wW4791一区

<rt id="2sa6s"></rt>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

字節(jié)跳動(dòng)大模型：實(shí)用，實(shí)用主義

2024-07-12 09:21

零壹財(cái)經(jīng)

關(guān)注

作者丨陳江

來(lái)源丨零壹智庫(kù)

字節(jié)跳動(dòng)無(wú)疑是當(dāng)前互聯(lián)網(wǎng)平臺(tái)的流量之王，也是媒體眼中的實(shí)用主義者。在當(dāng)紅的大模型賽道上，流量手段和實(shí)用路徑依然體現(xiàn)得淋漓盡致。

01

“算法”基因

其實(shí)，字節(jié)挑動(dòng)在AI方面的布局、應(yīng)用的時(shí)間可能遠(yuǎn)早于一眾大廠。2012年剛成立的時(shí)候，字節(jié)推出基于智能推薦算法的產(chǎn)品“今日頭條”APP，成為國(guó)內(nèi)最早將人工智能技術(shù)運(yùn)用到移動(dòng)應(yīng)用場(chǎng)景的科技公司之一。

2016年，字節(jié)跳動(dòng)更進(jìn)一步，成立人工智能實(shí)驗(yàn)室，開(kāi)始針對(duì)AI技術(shù)進(jìn)行系統(tǒng)性的研發(fā)與儲(chǔ)備。2019年，字節(jié)收購(gòu)了英國(guó)一家利用人工智能創(chuàng)作音樂(lè)的公司Jukedeck，后者創(chuàng)始人&CEO埃德·牛頓-里克斯（Ed Newton-Rex）隨后加盟字節(jié)跳動(dòng)并擔(dān)任人工智能實(shí)驗(yàn)室主任。

2020年之后，字節(jié)又將AI技術(shù)廣泛應(yīng)用在抖音、今日頭條等APP上，推出繪畫(huà)、特效類(lèi)等AIGC功能，同時(shí)也積極探索大模型應(yīng)用場(chǎng)景，比如抖音AI繪圖、飛書(shū)智能伙伴、剪影AI生成視頻等。

除了自己發(fā)力研發(fā)外，字節(jié)跳動(dòng)還對(duì)外做了大量的人工智能相關(guān)投資。

據(jù)零壹智庫(kù)梳理統(tǒng)計(jì)，截至目前，字節(jié)在人工智能領(lǐng)域出手投資達(dá)到26次（含并購(gòu)），其中行業(yè)應(yīng)用層面19次，占比73.1%。

在大模型方面，字節(jié)比百度等大廠略晚，2023年8月，宣布云雀大模型上線，但也趕上了備案頭班車(chē)，成為國(guó)內(nèi)首批算法備案的大模型之一。這亦是“豆包”等一些列應(yīng)用產(chǎn)品的技術(shù)支撐與底座。上線后，該大模型每天平均處理的token數(shù)量高達(dá)1200億，相當(dāng)于1800億的漢字或生成3000萬(wàn)張圖片。

02

全家桶

今年5月15日，2024春季火山引擎FORCE原動(dòng)力大會(huì)在北京舉行。會(huì)上，字節(jié)跳動(dòng)旗下火山引擎正式全員亮相了豆包大模型。這是一個(gè)模型大家族，包括通用模型pro、通用模型lite、語(yǔ)音識(shí)別模型、語(yǔ)音合成模型、文生圖模型等9款產(chǎn)品。

而此時(shí)，豆包在流量上已經(jīng)以迅雷之勢(shì)站上舞臺(tái)中央。

據(jù)原動(dòng)力大會(huì)發(fā)布的數(shù)據(jù)顯示，豆包在蘋(píng)果APP Store和各大安卓應(yīng)用市場(chǎng)的下載量突破1億，在AIGC類(lèi)應(yīng)用中排名第一，月度活躍用戶突破2600萬(wàn)，智能體創(chuàng)建總數(shù)達(dá)800萬(wàn)。

To B方面，火山引擎于2023年6月上線了MaaS平臺(tái)，即火山方舟。這個(gè)平臺(tái)匯集了國(guó)內(nèi)科技公司和科研院所的優(yōu)秀模型（比如百川智能、復(fù)旦大學(xué)MOSS等），有點(diǎn)類(lèi)似打造大模型領(lǐng)域的電商平臺(tái)模式，幫助企業(yè)為不同場(chǎng)景選擇合適的模型，同時(shí)提供充沛算力、安全互信等方面的支持。

火山方舟發(fā)布后，公司與汽車(chē)、手機(jī)、金融、食品飲料等領(lǐng)域的龍頭企業(yè)展開(kāi)了密切合作，包括吉利汽車(chē)、長(zhǎng)城汽車(chē)、OPPO、vivo、小米、華碩、招商銀行、海底撈等。

不管是面向個(gè)人消費(fèi)者的C端，亦或是面向廣大產(chǎn)業(yè)的B端，字節(jié)均是有了相當(dāng)?shù)挠脩艋鶖?shù)之后，再做大模型的全面發(fā)布。這種戰(zhàn)略與其他絕大多數(shù)玩家是不一樣的，后者往往是將大模型和應(yīng)用產(chǎn)品一同發(fā)布，再去開(kāi)拓市場(chǎng)。

本次字節(jié)全員亮相的豆包大模型（前身即云雀），涵蓋了文本對(duì)話、語(yǔ)音識(shí)別與合成、聲音復(fù)刻、角色扮演、文生圖等基礎(chǔ)功能與產(chǎn)品，并進(jìn)行了多方面的升級(jí)。其應(yīng)用場(chǎng)景非常廣泛，包括但不限于辦公智能助手、電商導(dǎo)購(gòu)、營(yíng)銷(xiāo)創(chuàng)作、編程助手等50余個(gè)業(yè)務(wù)場(chǎng)景。

針對(duì)B端，火山方舟已升級(jí)到2.0，可以讓企業(yè)更加高效、簡(jiǎn)易地實(shí)現(xiàn)AI創(chuàng)新和應(yīng)用落地，同時(shí)降低企業(yè)使用大模型的成本和技術(shù)門(mén)檻。應(yīng)用場(chǎng)景包括智能外呼、數(shù)字人、數(shù)據(jù)助理等等。

03

價(jià)格戰(zhàn)

為了搶占企業(yè)用戶市場(chǎng)份額，字節(jié)大模型大打價(jià)格戰(zhàn)。其中，豆包主力模型在企業(yè)市場(chǎng)的定價(jià)為0.00008元/千 Tokens，比行業(yè)價(jià)格降低了99.3%。

圖1：大模型定價(jià)對(duì)比（單位：元/千Tokens）

數(shù)據(jù)來(lái)源：火山引擎FORCE原動(dòng)力大會(huì)，零壹智庫(kù)

對(duì)于大降價(jià)原因，火山引擎總裁譚待在接受媒體采訪時(shí)表示，一方面，字節(jié)跳動(dòng)在在模型結(jié)構(gòu)、訓(xùn)練、生產(chǎn)等各種技術(shù)層面都能做到很好，有很多優(yōu)化手段能夠?qū)崿F(xiàn)降價(jià)。此外，市場(chǎng)對(duì)降價(jià)呼聲比較大，平臺(tái)必須把試錯(cuò)成本做到非常低，才能讓大家用起來(lái)。

另一方面，用戶規(guī)模的擴(kuò)大也將提升大模型的性能。大的使用量，才能打磨出好模型，也能大幅降低模型推理的單位成本。

B端企業(yè)市場(chǎng)是大模型廠商的兵家必爭(zhēng)之地，因?yàn)榭梢蕴峁└苯�、且可以預(yù)測(cè)的現(xiàn)金流收入。而C端要落地到具體應(yīng)用中，需要很長(zhǎng)的時(shí)間來(lái)開(kāi)發(fā)市場(chǎng)、教育用戶，并且如何盈利一切都是未知數(shù)。

百度的文心一言、阿里的通義千問(wèn)服務(wù)的企業(yè)客戶眾多，分別高達(dá)8.5萬(wàn)家、9萬(wàn)家，市場(chǎng)占有率相對(duì)更高一些。

豆包大模型價(jià)格大降，亦是想通過(guò)價(jià)格戰(zhàn)與百度、阿里正面PK，搶奪更多的企業(yè)用戶。

面對(duì)字節(jié)的打骨折，阿里宣布跟進(jìn)大降價(jià)，將通義千問(wèn)GPT-4級(jí)別的主力模型Qwen-Long的API輸入價(jià)格，從每千個(gè)token的0.02元降至0.0005元，比字節(jié)還低0.0003元。

04

砸廣告

在C端市場(chǎng)，字節(jié)跳動(dòng)亦是高舉高打。

據(jù)Quest Mobile數(shù)據(jù)顯示，2024年1月，豆包APP在人工智能生成內(nèi)容（AIGC）APP活躍用戶排行榜中排名第一。到了3月，月活用戶量亦是文心一言的1.5倍。

即便如此，豆包依然不滿足，將重心放在如何搞流量上。

用戶活躍數(shù)、訪問(wèn)使用量等核心經(jīng)營(yíng)指標(biāo)是C端大模型廠商能否活下去，或者說(shuō)未來(lái)能夠?qū)崿F(xiàn)商業(yè)化的核心基礎(chǔ)。包括豆包在內(nèi)的大模型廠商掀起了燒錢(qián)大戰(zhàn)，買(mǎi)用戶。

據(jù)AppGrowing統(tǒng)計(jì)，2024年6月第一周（6/3-6/9），豆包素材投放量高達(dá)26521個(gè)，環(huán)比增長(zhǎng)38.6%。相對(duì)而言，Kimi為14451個(gè)，環(huán)比增長(zhǎng)160.7%；智譜清言為1866個(gè)，環(huán)比飆升2456%。

線上渠道方面，大廠們主要聚焦在吸納了眾多年輕人的B站社區(qū)上，6月第一周AI廣告投放量是去年同期的3-4倍。

除B站外，線上推廣渠道進(jìn)一步擴(kuò)散至小紅書(shū)、抖音等平臺(tái)。比如，在抖音平臺(tái)上，單個(gè)AI相關(guān)詞條下，豆包硬廣、軟廣外，還有頭部達(dá)人帶貨。在小紅書(shū)上，合作KOL發(fā)布體驗(yàn)視頻、利用話題標(biāo)簽增加曝光、舉辦互動(dòng)問(wèn)答和抽獎(jiǎng)活動(dòng)等方式進(jìn)行推廣。

線下渠道方面，一二線主要城市的寫(xiě)字樓、地鐵、機(jī)場(chǎng)等白領(lǐng)聚集的場(chǎng)所，都成為推廣的重要戰(zhàn)場(chǎng)。

僅僅在6月上旬，豆包廣告投放金額就已經(jīng)高達(dá)1.24億元，令眾多大廠有些望塵莫及。

05

犯忌諱

此外，為了流量，豆包大模型劍走偏鋒，甚至“不擇手段”。

今年5月底，據(jù)一些網(wǎng)友爆料，百度和谷歌的搜索結(jié)果中，除了廣告之外，第一頁(yè)全部來(lái)自豆包生成的內(nèi)容。在谷歌搜索引擎里更是生成超過(guò)2000萬(wàn)條各式各類(lèi)的詞條內(nèi)容并進(jìn)行固化。

這些內(nèi)容也會(huì)關(guān)聯(lián)搜索引擎高點(diǎn)擊率的關(guān)鍵詞，從而獲取訪問(wèn)流量，或者被其他大模型抓取并使用，以達(dá)到推廣豆包之目的。

豆包的做法，也并不難理解。簡(jiǎn)單來(lái)說(shuō)，通過(guò)數(shù)據(jù)進(jìn)行訓(xùn)練，訓(xùn)練好后對(duì)人類(lèi)的原創(chuàng)內(nèi)容進(jìn)行“洗稿”，再將之作為“全新原創(chuàng)”內(nèi)容，并通過(guò)算法進(jìn)行大量分發(fā)，進(jìn)入到搜索引擎數(shù)據(jù)庫(kù)中。

去年的一篇論文——《遞歸的詛咒：在生成數(shù)據(jù)上訓(xùn)練會(huì)使模型遺忘》就詳細(xì)講解了當(dāng)模型使用生成的數(shù)據(jù)進(jìn)行訓(xùn)練時(shí)，生成數(shù)據(jù)如何污染下一代模型的訓(xùn)練集，導(dǎo)致模型逐漸失去對(duì)原始數(shù)據(jù)的正確感知，出現(xiàn)模型崩潰現(xiàn)象。

很快，豆包的做法引發(fā)了社會(huì)輿情的反彈以及其他AI大模型廠商的警覺(jué)。一方面，豆包自己進(jìn)行了整改與優(yōu)化。另一方面，谷歌下架了所有豆包的詞條內(nèi)容。此外，國(guó)內(nèi)各大互聯(lián)網(wǎng)公司也針對(duì)AI生成的詞條以及低質(zhì)量的語(yǔ)料修改了算法。

原文標(biāo)題 : 字節(jié)跳動(dòng)大模型：實(shí)用，實(shí)用主義