訂閱
糾錯
加入自媒體

從Sora2到蒸汽機2:被引爆的AI視頻全球競速

翼言商業(yè)觀察

“AI視頻生成領(lǐng)域,一定會誕生一個超級應用。”

10月以來,AI視頻生成領(lǐng)域卷出了新高度。

上周,發(fā)布Vidu Q2圖生視頻不到2周,Vidu10月21日再次更新:參考生、時長最多可延長至五分鐘、APP從AI創(chuàng)作平臺轉(zhuǎn)變?yōu)橐徽臼紸I內(nèi)容社交平臺。

生數(shù)科技的緊迫感并非孤例。上上周,10月15日,百度視頻生成模型蒸汽機再次升級——這已經(jīng)是其7月 2日上線以來的第三次重大升級。

這兩場密集發(fā)布背后,是10月1日OpenAI扔下的那顆“炸彈”。當天,Sora 2及其社交應用上線,憑借生成技術(shù)的突破和社交化的創(chuàng)新玩法,首周下載量超ChatGPT同期,OpenAI CEO山姆·奧特曼“偷GPU被抓”“與李小龍對打”等內(nèi)容席卷全網(wǎng)。

全球巨頭的“應激反應”迅速展開。10月8日,埃隆·馬斯克xAI推出Imagine v0.9,以20秒快速生成、全用戶免費發(fā)起“反擊”;10月16日,谷歌發(fā)布Veo 3.1,強調(diào)物理引擎精準度,其Fast版本生成速度提升3倍。國內(nèi)戰(zhàn)場更顯激烈:從百度蒸汽機到快手可靈,再到生數(shù)科技和好耶科技(FilmAction),都是“國慶中秋8天無休”的狀態(tài),快手研究院農(nóng)雅晴直言:“這個行業(yè)本來就很卷,節(jié)假日加班并不意外”。

這場席卷全球的AI視頻生成“軍備競賽”,早已超越單純的技術(shù)比拼。從硅谷創(chuàng)業(yè)公司到中國互聯(lián)網(wǎng)大廠,從OpenAI到谷歌,從百度、可靈到好耶、生數(shù),近百億美元資本與數(shù)千名工程師的投入,折射出科技產(chǎn)業(yè)對下一代內(nèi)容交互革命的集體押注。喧囂背后,技術(shù)突破與商業(yè)泡沫、創(chuàng)作平權(quán)與職業(yè)替代、創(chuàng)新紅利與倫理風險的博弈,正將這個賽道推向更復雜的十字路口。

現(xiàn)象級爆發(fā):Sora2點燃了“火藥桶”

在Sora2最初放出的視頻中,籃球投偏后反彈落地、花滑選手頭頂一只貓完成三周半跳、雨滴落地后濺起,甚至多物體復雜場景的運動,都能精準模擬物理世界的運行規(guī)律。此外,Sora 2實現(xiàn)了原生音畫同步,支持多語言對白與環(huán)境音效對齊,角色也能在多鏡頭中保持一致。這種接近影視級的生成效果,再次拉高了行業(yè)參照系。

Sora2生成視頻-2-偷GPU.gif

丨Sora2生成的山姆·奧特曼偷GPU

更具突破性的是其社交玩法:用戶上傳一張自拍照,輸入“在月球上跳舞”,Sora 2就能生成10秒高復刻度的用戶在月球跳舞的視頻,還能通過Remix功能讓好友“加入”共舞。山姆·奧特曼的個人肖像權(quán)開放,網(wǎng)友腦洞大開的玩梗創(chuàng)作進一步放大了出圈效應。這種“即時創(chuàng)作+社交裂變”的模式,使Sora 2在邀請制下仍5天內(nèi)登頂美國App Store免費榜,下載量突破1000萬次,遠超ChatGPT初期增速。

這場爆發(fā)并非偶然。

技術(shù)層面,無論是對物理世界的模擬精度還是音畫同步、敘事和運鏡能力,Sora 2顯然都有了明顯的提升。而它從視頻生成工具升級為基于視頻生成的社交化產(chǎn)品,更是為其出圈加了一把烈火。

對此,好耶科技創(chuàng)始人吳杰茜認為,當AI視頻生成的技術(shù)提高、門檻降低之后,大眾的視頻化社交需求一定會被進一步激發(fā),Sora 2的出圈顯然說明,這是一個經(jīng)過驗證的產(chǎn)品方向。更重要的是,“這極大提高了AI視頻生成的大眾關(guān)注度和認知度,給相關(guān)企業(yè)帶來更多的市場機會。”

當前,AI視頻生成已經(jīng)在電商、廣告、短視頻等多個領(lǐng)域開始落地,甚至參與影視制作:Netflix在2023年就發(fā)布了首部AIGC動畫短片《犬與少年》;2024年,快手聯(lián)合李少紅、賈樟柯等九位知名導演開啟了“可靈AI導演共創(chuàng)計劃”,推出了9部AIGC電影短片;今年4月,新加坡上映了全球首部院線公映的AI電影《海上女王鄭一嫂》,長達70分鐘,成本尚不及傳統(tǒng)方式的1/10。當制作商業(yè)視頻的成本指數(shù)級下降,需求的爆發(fā)就順理成章。

據(jù)Fortune Business  Insights數(shù)據(jù),2024年全球AI視頻生成市場規(guī)模已達6.15億美元,2025年將達到7.17億美元,預計2032年將增至25.63億美元,年復合增長率達20%。中金更為樂觀,認為僅中期來看,創(chuàng)作者和B端生產(chǎn)力工具市場規(guī)模就有望突破100億美元。

全球競速:科技巨頭的“生存焦慮”與創(chuàng)業(yè)公司的“生死時速”

Sora2的發(fā)布和出圈,瞬間激活了全球科技公司的神經(jīng)。馬斯克推出Imagine v0.9,主打“電影級運鏡”,支持“一鏡到底”生成;谷歌發(fā)布Veo 3.1和Veo3.1Fast,前者強調(diào)“物理引擎精準度”,后者則將生成速度提升3倍。

在國內(nèi),無論是科技大廠還是初創(chuàng)公司,這種競速也在上演。與谷歌同日,百度10月15日發(fā)布蒸汽機升級版,支持無限時長生成和實時交互;生數(shù)科技10月21日推出Vidu Q2,首次上線“視頻延長”功能,最長擴展至5分鐘,其“生成演技”技術(shù)能精準控制人物微表情,確保同一角色在不同場景中的一致性。

百度蒸汽機-2.jpg丨百度蒸汽機在行業(yè)內(nèi)首次實現(xiàn)AI長視頻實時交互生成

值得一提的是,百度蒸汽機團隊采用自回歸擴散模型,并結(jié)合流式滑窗架構(gòu),在行業(yè)內(nèi)首次實現(xiàn)了AI長視頻實時交互生成:在生成過程中,用戶可實時交互,隨時改寫內(nèi)容或擴寫續(xù)集,這意味著 AI 視頻生成從 “開盲盒”“一次性輸出” 進入 “動態(tài)創(chuàng)作流” 階段。

Vidu Q2.jpg丨Vidu Q2首頁,玩法對標Sora2

Vidu 更是在社交玩法上直接對標Sora2。在Vidu AI APP,點擊“二次創(chuàng)作”,@一下主體就可以生成一段合拍視頻,可以與自己喜歡的角色合拍,也可以基于他人創(chuàng)作的視頻進行二創(chuàng)。APP里還內(nèi)置了海量主體庫,以及包括人物、動物、特效等的豐富素材,用戶可以直接選用喜歡的主體,隨時隨地隨手生成你想要的視頻。不生成也沒關(guān)系,你大可以像刷視頻號或抖音一樣刷各類AI視頻內(nèi)容。Vidu AI APP也已經(jīng)成了集內(nèi)容創(chuàng)作、互動和分發(fā)于一體的平臺。

與吳杰茜的對話是在周日(10月26日)下午,她直言“沒有周末,每天都排滿了”。她創(chuàng)立的好耶科技(FilmAction)專注于完整劇集的制作,Sora2發(fā)布之后,其團隊更是一直處于連軸轉(zhuǎn)的狀態(tài)。

時不我待的緊迫感背后是創(chuàng)業(yè)公司的生存焦慮。2023年以來,國內(nèi)AI視頻初創(chuàng)企業(yè)超過15家,但隨著技術(shù)進一步成熟,行業(yè)已從技術(shù)競賽轉(zhuǎn)向商業(yè)化驗證階段,正在經(jīng)歷快速洗牌,頭部效應顯著。有不愿具名的業(yè)內(nèi)人士預測,今年會成為存亡分水嶺,活下來的不會超過3家。

filmaction.png丨FilmAction支持一鍵生成完整敘事級短片

不過,對于Sora2帶來的這種競速加劇,吳杰茜認為是行業(yè)利好:“能給同行帶來更多機會,市場足夠大,各家企業(yè)都能分到蛋糕,關(guān)鍵在于產(chǎn)品力和落地能力”。她介紹,F(xiàn)ilmAction支持一鍵生成完整敘事級短片,非專業(yè)用戶也可以直接產(chǎn)出1分鐘含分鏡、配音等全流程的高質(zhì)量視頻,已經(jīng)承接了大量的短劇業(yè)務。

行業(yè)競速背后,對超級應用的追逐,不僅是全球科技企業(yè)的核心關(guān)切之一,也是資本尋找和下注的目標。農(nóng)雅晴和吳杰茜都認為,AI視頻生成領(lǐng)域一定會誕生一個超級應用。吳杰茜還表示,資本近期正在進一步押注國內(nèi)潛力項目,但并未透露具體名稱。

三重隱憂:熱賽道的冷思考

當行業(yè)沉浸在“AI視頻的iPhone時刻”的狂熱中,一些深層問題已悄然浮現(xiàn)。這場技術(shù)革命的影響,遠比想象中復雜。

首先是技術(shù)狂歡下的需求泡沫和技術(shù)瓶頸。表面繁榮的數(shù)據(jù)背后,可能隱藏著“偽需求”陷阱。某MCN機構(gòu)負責人透露,用AI生成的帶貨視頻轉(zhuǎn)化率比真人拍攝低30%左右,用戶認為“畫面很炫,但沒有真人推薦的可信”。這也暴露了當前AI視頻在電商場景下的核心矛盾:技術(shù)能解決“有沒有”,卻難以解決情感連接和信任建立。

可靈AI導演共創(chuàng)計劃 .png丨2024年,快手聯(lián)合賈樟柯等九位導演發(fā)起“可靈AI導演共創(chuàng)計劃”,已推出9部電影短片

而AI生成視頻的影視級應用,目前依然處于前期的探索階段,所謂“影視圈抖三抖”不過是一種修辭。FilmAction雖然支持一鍵生成完整敘事級短片,但吳杰茜依然明確表示,AI無法達到完全專業(yè)和商業(yè)化的水平,只能輔助創(chuàng)作者從0-5的基礎(chǔ)部分。同樣,盡管快手也已經(jīng)較早開始了AI影視化嘗試,但農(nóng)雅晴依然謹慎表示:“在影視化的規(guī);涞貞蒙胁淮_定。”

其次是創(chuàng)意平權(quán)與職業(yè)替代的陣痛,AI視頻生成能力的提升正在消解專業(yè)壁壘。過去一條廣告需要腳本、分鏡、拍攝、剪輯等多工種協(xié)作,現(xiàn)在一個人用AI就能完成。這自然使中小創(chuàng)作者獲得了前所未有的機會,但也讓傳統(tǒng)影視從業(yè)者面臨失業(yè)沖擊。更令人唏噓的是,AI催生的新職業(yè)可能最先被顛覆。一年前,AI分鏡師還被視為AIGC時代“饋贈”的一個香餑餑,但如今,根據(jù)劇本生成分鏡幾乎已經(jīng)成為AI視頻生成工具的標配。

擬態(tài)環(huán)境的混亂和認知危機則是AI視頻對我們現(xiàn)實信息環(huán)境層面的影響。柏拉圖的“洞穴寓言”中,囚徒通過墻上的影子認識世界;如今,AI生成的視頻讓影子更逼真,卻可能更扭曲。當“奧特曼偷GPU”的視頻被大量轉(zhuǎn)發(fā),當AI生成的明星出軌片段在社交媒體瘋傳,公眾的信息甄別能力正面臨嚴峻考驗。技術(shù)狂奔時,我們是不是也需要問一問:用戶真的需要無限逼真的視頻嗎?可靠、值得信任的信息是不是更難獲得?

結(jié)語:視頻生成的“iPhone時刻”之后

2022年11月30日,ChatGPT的發(fā)布標志著AI從實驗室真正走向大眾;2025年10月,Sora2的爆發(fā)正將視頻生成推向類似拐點。但歷史告訴我們,技術(shù)革命的影響往往需要更長時間顯現(xiàn),就像互聯(lián)網(wǎng)誕生30年后,我們才真正理解其對社會的全方位重塑。

AI視頻生成賽道的火熱,本質(zhì)是科技企業(yè)對下一代內(nèi)容交互范式的爭奪。與其說AI視頻生成是在制造工具,不如說它是在塑造未來的表達方式。在這場競賽中,既有技術(shù)突破的興奮,也有泡沫風險的隱憂;既有創(chuàng)作平權(quán)的曙光,也有職業(yè)替代的陣痛。最終能存活下來的玩家,不僅需要技術(shù)實力,更需要對人性的洞察和對責任的敬畏。當AI視頻生成真正成為全民表達的工具,其價值將超越商業(yè)本身,成為人類創(chuàng)意的放大器。而這一天的到來,需要技術(shù)的持續(xù)突破,更需要整個社會做好準備:準備好迎接更豐富的創(chuàng)意,也準備好應對更復雜的挑戰(zhàn)。

每一次技術(shù)狂奔,都是舊世界裂縫里透出的光。AI視頻生成把“制片廠”塞進顯卡,讓創(chuàng)意平權(quán),也留給我們多重思考。這個賽道會不會真的誕生AI時代的第一個超級應用不重要,重要的是,這是新世界被撕下的第一張?zhí)羌,裹著AI時代真正的命題:當算法可以模擬一切感官,人類還愿意為什么樣的故事買單?當算力成為基礎(chǔ)設施,創(chuàng)意、情感與信任才是最后的稀缺。

火焰還在升騰,有人看見灰燼,有人看見晨星。

END

       原文標題 : 從Sora2到蒸汽機2:被引爆的AI視頻全球競速

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號