DeepSeek的六萬張卡如何回本?
究其DeepSeek訓(xùn)練其模型到底使用了多少張英偉達(dá)卡,據(jù)《DeepSeek-V3技術(shù)報(bào)告》官方給出的是2048張英偉達(dá)H800芯片和1萬張A100顯卡。而半導(dǎo)體研究機(jī)構(gòu)SemiAnalysis認(rèn)為DeepSeek囤積了包括1萬張A100、1萬張H100、1萬張?zhí)毓┌鍴800、3萬張?zhí)毓┌鍴20在內(nèi)的六萬張英偉達(dá)GPU卡。
不重要,這不是本文要討論的。
而,DeepSeek的這六萬張卡如何回本?
簡而言之一個詞:開源。
以下是本文邏輯:
1、”DeepSeek+”行情到來,開源背后的經(jīng)濟(jì)賬
2、都在搞錢,那么DeepSeek的錢怎么搞?
01
“DeepSeek+”行情到來,開源背后的經(jīng)濟(jì)賬
2月10日,OpenAI創(chuàng)始人山姆·奧特曼在個人博客分享了他對人工智能經(jīng)濟(jì)學(xué)的三個觀察(《Three Observations》)。他分享了人工智能經(jīng)濟(jì)學(xué)的三個觀察。
(一)AI模型的智能水平大致等于用于訓(xùn)練和運(yùn)行它所需資源的對數(shù)值。這些資源主要包括訓(xùn)練算力、數(shù)據(jù)和推理算力。實(shí)踐表明,投入的資金可以持續(xù)帶來可預(yù)測的收益提升;這種scaling law在多個數(shù)量級的范圍內(nèi)都保持準(zhǔn)確。
(二)使用特定水平AI的成本每12個月下降約10倍,較低的價格又會帶來更廣泛的應(yīng)用。這一點(diǎn)可以從2023年初的GPT-4到2024年中的GPT-4o的變化中得到印證,其中每個token的價格在這段時間內(nèi)降低了約150倍。相比之下,摩爾定律以每18個月翻倍的速度改變了世界,而AI的發(fā)展速度則更為驚人。
(三)智能的線性增長能帶來超指數(shù)級的社會經(jīng)濟(jì)價值。因此,我們看不到任何理由認(rèn)為這種指數(shù)級增長的投資會在近期停止。
在山姆·奧特曼的“AI經(jīng)濟(jì)學(xué)”框架中,模型能力的提升與成本的邊際遞減是其核心命題。據(jù)山姆·奧特曼在接受采訪中稱,隨著智能模型固定級別的智力水平的一旦實(shí)現(xiàn),其訓(xùn)練成本每年都會下降約10倍。“這很瘋狂!就像摩爾定律是溫和的改變世界!”山姆·奧特曼感嘆。
不得不說,除了其實(shí)踐經(jīng)驗(yàn),OpenAI最近這關(guān)于開源的最新認(rèn)可,和DeepSeek最近在商業(yè)上的“倒逼”有著直接關(guān)系。開源策略的深層意義,在于構(gòu)建一個“技術(shù)-數(shù)據(jù)-商業(yè)”的飛輪。
2月17日,DeepSeek正式宣布接入微信并開展灰度測試。DeepSeek與微信的合作,本質(zhì)是將模型能力嵌入高頻社交場景,獲取海量用戶交互數(shù)據(jù)。
2月3日,DeepSeek官宣與阿里云以及百度智能云聯(lián)合,通過云服務(wù)觸達(dá)企業(yè)客戶,通過共享技術(shù)資源、優(yōu)化算法等方式,進(jìn)行生態(tài)共建。
2月初,DeepSeek和三大運(yùn)營商達(dá)成戰(zhàn)略合作,實(shí)現(xiàn)AI技術(shù)在通信服務(wù)中的深度融入,這包括網(wǎng)絡(luò)管理、服務(wù)優(yōu)化、用戶體驗(yàn)等多個維度的突破性進(jìn)展。
1月29日,微軟和DeepSeek共同宣布,DeepSeek-R1已經(jīng)在微軟的AI平臺Azuer AI Foundry和Github可用,開發(fā)者可以使用新模型進(jìn)行測試和構(gòu)建基于云的應(yīng)用程序和服務(wù)。
以阿里云為例,其平臺AI組件產(chǎn)品PAI Model Gallery支持云上一鍵部署DeepSeek系列模型,包括DeepSeek-V3、DeepSeek-R1等。用戶無需編寫代碼,即可通過阿里云平臺實(shí)現(xiàn)模型訓(xùn)練的過程。值得一提的是, PAI Model Gallery自身是對阿里云用戶開源的。而PAI Model Gallery的兩種資費(fèi)方式,在線服務(wù)(EAS)計(jì)費(fèi)和分布式訓(xùn)練(DLC)計(jì)費(fèi),都是根據(jù)用戶實(shí)際使用的資源來計(jì)算費(fèi)用的,比如按使用時間或者次數(shù)來收費(fèi)。這代表了AI開源業(yè)界普遍的一種收費(fèi)模式。
DeepSeek和這些B端企業(yè)的合作模式類似于Android的開源生態(tài):DeepSeek提供底層模型框架,合作伙伴貢獻(xiàn)場景與數(shù)據(jù),最終通過模型迭代實(shí)現(xiàn)“越用越強(qiáng)”的正循環(huán)。
山姆·奧特曼對AI算力趨勢的深刻觀察,正體現(xiàn)在DeepSeek 的算力創(chuàng)新中。DeepSeek-V3的崛起——通過開源模式和技術(shù)創(chuàng)新,將訓(xùn)練成本壓縮至557.6萬美元(基于H800 GPU租賃成本計(jì)算),僅為同類閉源模型的1/10甚至更低。這種成本優(yōu)勢的背后,是算法、框架與硬件的協(xié)同優(yōu)化:FP8混合精度訓(xùn)練使計(jì)算效率提升20%以上,而DeepSeekMoE架構(gòu)以及多頭潛在注意力機(jī)制(MLA)架構(gòu),通過細(xì)粒度專家分配,讓每個Token的激活參數(shù)僅占模型總規(guī)模的5.5%(37B/671B)。
因?yàn)槠漭^低的硬件成本投入,DeepSeek-R1的發(fā)布一度使得英偉達(dá)股價大跌。但有趣的是,根據(jù)經(jīng)濟(jì)學(xué)杰文斯悖論,算力創(chuàng)新和大幅提升的背后,恰恰會帶動高性能硬件(如英偉達(dá)GPU)的需求并使其可能會呈現(xiàn)反彈式增長。
這與杰文斯悖論的核心邏輯相吻合:即技術(shù)進(jìn)步提高了資源利用效率,降低了成本,進(jìn)而刺激了需求增加,最終導(dǎo)致資源消耗總量的上升。
多說一句杰文斯悖論:英國經(jīng)濟(jì)學(xué)家杰文斯發(fā)現(xiàn),19世紀(jì)中葉,隨著第一次工業(yè)革命工業(yè)化的進(jìn)程,蒸汽機(jī)效率的提升雖然使煤的使用更加經(jīng)濟(jì),但結(jié)果卻是煤炭的需求飆升。這其實(shí)恰恰滿足了均衡理論中的供需關(guān)系的改變:即價格降低,勢必會帶來需求量的大幅提升。產(chǎn)品便宜了,買家自然就會變多。
2月12日,英偉達(dá)在博客中介紹了利用 DeepSeek-R1 和推理時擴(kuò)展技術(shù)來自動生成優(yōu)化 GPU 內(nèi)核的最新研究成果,效果異常的好。英偉達(dá)表示,其對于 DeepSeek-R1 的最新進(jìn)展及其應(yīng)用潛力感到非常興奮。
智能的線性增長能帶來超指數(shù)級的社會經(jīng)濟(jì)價值。大模型技術(shù)的發(fā)展迭代,必將反哺整個人工智能和芯片行業(yè)的發(fā)展迭代速率。
這里我們來具體算一筆賬吧。
賬本落在經(jīng)濟(jì)上,大模型開源,各方怎么個互惠互利?
一句話:B端(企業(yè))得到DeepSeek的大模型賦能,C端(用戶)得到B端企業(yè)更好的服務(wù),而DeepSeek則得到B端企業(yè)的算力和其服務(wù)的C端的用戶和數(shù)據(jù)。
DeepSeek的六萬張顯卡投入,這筆重要且巨大的開支,通過開源,DeepSeek能夠?qū)⑦@些成本分?jǐn)偟秸麄生態(tài)系統(tǒng)中。一方面,開源吸引了大量的開發(fā)者和企業(yè)參與到模型的訓(xùn)練和優(yōu)化中,降低了單個企業(yè)的投入成本,也就是降低了單個企業(yè)用于構(gòu)建人工智能大模型的邊際費(fèi)用;另一方面,開源也促進(jìn)了DeepSeek技術(shù)的快速迭代和升級,提高了模型的性能和準(zhǔn)確性,從而降低了后期的維護(hù)成本。此外,通過與其他企業(yè)的合作,DeepSeek還能夠獲得額外的收入來源,如技術(shù)授權(quán)、定制化服務(wù)等。
開源代碼不僅降低了DeepSeek自身的開發(fā)成本,還為合作方帶來了技術(shù)上的節(jié)省成本杠桿。通過共享代碼和算法,DeepSeek能夠幫助合作方快速構(gòu)建和優(yōu)化自己的AI模型,避免了重復(fù)投入和研發(fā)周期。此外,DeepSeek還提供了豐富的訓(xùn)練數(shù)據(jù)和工具,使得合作方能夠更加高效地訓(xùn)練和優(yōu)化模型。這些節(jié)省下來的成本,可以成為合作方進(jìn)一步投入AI領(lǐng)域的動力。而這一切,也都來自DeepSeek的模型創(chuàng)新。
自此,不難理解關(guān)于DeepSeek“國運(yùn)級應(yīng)用”的評價了。
02
都在搞錢,那么DeepSeek的錢怎么搞?
眾所周知,DeepSeek目前是免費(fèi)的,并成功倒逼一眾人工智能大模型公司也隨之宣布其產(chǎn)品未來免費(fèi)供給C端。
但正如所有企業(yè)都需要營利,天下并沒有免費(fèi)的午餐。DeepSeek的搞錢之道,依然是開源,開源,開源。
其具體邏輯,通過B端開源技術(shù)降維與生態(tài)鎖定:即用開源代碼降低B端客戶接入門檻,再用增值服務(wù)構(gòu)建自身的壁壘。B端免費(fèi)算力與數(shù)據(jù)反哺:即用對B端的開源獲取B端免費(fèi)的算力;B端的廣泛覆蓋又反哺C端的全方位覆蓋,從而帶來更多token樣本(token是數(shù)據(jù)在被模型處理之前或過程中被分割成的最小單元),大量開源得到的token樣本加成會使DeepSeep自身模型算力成本大幅降低,算力效率大幅飛躍使自身模型更優(yōu)化,從而又大幅降低自身模型開發(fā)維護(hù)升級成本。
這種“算力-數(shù)據(jù)-模型”的三角循環(huán),使得DeepSeek的單位訓(xùn)練成本降低,DeepSeek也正像其無需人工進(jìn)行標(biāo)注的機(jī)器學(xué)習(xí)模型一樣,可以達(dá)到自學(xué)習(xí)、自維護(hù)、自營收益的高效階段。
具體來說,DeepSeek通過向B端用戶開源其技術(shù)和數(shù)據(jù)資源,吸引他們參與到模型的訓(xùn)練和優(yōu)化中。這些B端用戶可以是企業(yè)、研究機(jī)構(gòu)或開發(fā)者團(tuán)隊(duì)等,他們擁有豐富的數(shù)據(jù)和場景資源,能夠?yàn)槟P吞峁└佣鄻踊挠?xùn)練樣本和測試環(huán)境。通過向這些用戶提供技術(shù)支持,DeepSeek能夠降低大模型的算力成本和提高用戶的參與度。與此同時,這些B端用戶在使用模型的過程中也會產(chǎn)生大量的數(shù)據(jù)和反饋,這些數(shù)據(jù)可以用于進(jìn)一步優(yōu)化模型和提高其性能,促進(jìn)DeepSeek自身模型的快速迭代。這種向B端開源從而獲取算力和數(shù)據(jù)的模式,不僅降低了DeepSeek的運(yùn)營成本,還提高了其模型的準(zhǔn)確性和泛化能力。
同時,隨著B端用戶的不斷增加和深入?yún)⑴c,DeepSeek能覆蓋到更多的C端用戶和應(yīng)用場景。這些C端用戶可以是個人消費(fèi)者、中小企業(yè)或行業(yè)用戶等,他們對于智能化需求日益增加。通過向這些用戶提供智能化的服務(wù)和解決方案,DeepSeek能夠吸引他們參與到模型的訓(xùn)練和優(yōu)化中,從而進(jìn)一步增加Token訓(xùn)練樣本的數(shù)量和多樣性。這些Token訓(xùn)練樣本可以用于進(jìn)一步提高模型的準(zhǔn)確性和泛化能力,從而形成C端對B端的反哺。
獲得大量開源Token訓(xùn)練樣本能夠降低模型算力成本。DeepSeek利用這些樣本進(jìn)行更加高效的模型訓(xùn)練和優(yōu)化。這種“自迭代”使模型能夠在較少的算力硬件資源下達(dá)到更好的性能表現(xiàn)。這對于DeepSeek來說自然是一筆巨大的成本節(jié)省。
當(dāng)然,盡管DeepSeek在技術(shù)和應(yīng)用方面已經(jīng)取得了顯著的進(jìn)展,但目前仍然存在一些不完善之處。例如:對于某些復(fù)雜場景的處理能力有限等問題。
而通過開源策略的實(shí)施和生態(tài)系統(tǒng)的構(gòu)建,DeepSeek正在逐步解決這些問題。一方面通過吸引更多的開發(fā)者和企業(yè)參與到模型的訓(xùn)練和優(yōu)化中來增加token樣本的數(shù)量和多樣性;另一方面通過與合作伙伴的開源合作來拓展應(yīng)用場景和提高模型的泛化能力,充分提升模型處理復(fù)雜場景的能力,正如前文所提到。
DeepSeek的商業(yè)模式,似乎正創(chuàng)新出一條AI公司的“自進(jìn)化”之路。
DeepSeek的商業(yè)模式,本質(zhì)是一場“用模型養(yǎng)模型”的試驗(yàn):通過開源吸引生態(tài)伙伴,降低獲客與數(shù)據(jù)獲取成本;再通過B端增值服務(wù)與C端數(shù)據(jù)價值變現(xiàn),支撐算力擴(kuò)容;最后,模型性能提升吸引更多合作伙伴,獲得更多增值收益,形成無需人工干預(yù)的“數(shù)據(jù)-算力-收益”閉環(huán)。
這一路徑的可行性已初現(xiàn)端倪:DeepSeek-V3的后訓(xùn)練階段僅消耗5K GPU小時,不到預(yù)訓(xùn)練的0.2%,說明模型的自學(xué)習(xí)能力顯著增強(qiáng)。若其能持續(xù)壓縮迭代成本,六萬張顯卡的回本周期可能從行業(yè)平均的3-5年縮短至18個月。
然而,爭議依然存在。但無論如何,DeepSeek已證明:在AI的競技場上,低成本與高性能并非零和游戲,而開源生態(tài)可能是打破算力壟斷、提升算力效率的最優(yōu)解。
參考文獻(xiàn):
DeepSeek-V3技術(shù)報(bào)告解讀 來源:機(jī)器學(xué)習(xí)算法那些事
行業(yè)資訊 | Sam Altman凌晨發(fā)文,AI Agent將重塑世界經(jīng)濟(jì) 來源:深圳市人工智能行業(yè)協(xié)會
DeepSeek R1不編程就能生成GPU內(nèi)核,比熟練工程師好,驚到了英偉達(dá) 來源:機(jī)器之心
全網(wǎng)首發(fā) | PAI Model Gallery一鍵部署階躍星辰Step-Video-T2V、Step-Audio-Chat模型 來源:阿里云大數(shù)據(jù)AI平臺
原文標(biāo)題 : DeepSeek的六萬張卡如何回本?

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 4 “支付+”時代,支付即生態(tài) | 2025中國跨境支付十大趨勢
- 5 中國最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 7 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 張勇等人退出阿里合伙人
- 10 深圳跑出40億超級隱形冠軍:賣機(jī)器人年入6.1億,港股上市