人妻AV中出无码内射,国产精品有码无码,国产三级片色欲av自拍

<address id="nyim3"></address>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

DeepSeek的六萬(wàn)張卡如何回本？

2025-02-24 16:29

首席商業(yè)評(píng)論

關(guān)注

究其DeepSeek訓(xùn)練其模型到底使用了多少?gòu)堄ミ_(dá)卡，據(jù)《DeepSeek-V3技術(shù)報(bào)告》官方給出的是2048張英偉達(dá)H800芯片和1萬(wàn)張A100顯卡。而半導(dǎo)體研究機(jī)構(gòu)SemiAnalysis認(rèn)為DeepSeek囤積了包括1萬(wàn)張A100、1萬(wàn)張H100、1萬(wàn)張?zhí)毓┌鍴800、3萬(wàn)張?zhí)毓┌鍴20在內(nèi)的六萬(wàn)張英偉達(dá)GPU卡。

不重要，這不是本文要討論的。

而，DeepSeek的這六萬(wàn)張卡如何回本？

簡(jiǎn)而言之一個(gè)詞：開源。

以下是本文邏輯：

1、”DeepSeek+”行情到來(lái)，開源背后的經(jīng)濟(jì)賬

2、都在搞錢，那么DeepSeek的錢怎么搞？

01

“DeepSeek+”行情到來(lái)，開源背后的經(jīng)濟(jì)賬

2月10日，OpenAI創(chuàng)始人山姆·奧特曼在個(gè)人博客分享了他對(duì)人工智能經(jīng)濟(jì)學(xué)的三個(gè)觀察（《Three Observations》）。他分享了人工智能經(jīng)濟(jì)學(xué)的三個(gè)觀察。

（一）AI模型的智能水平大致等于用于訓(xùn)練和運(yùn)行它所需資源的對(duì)數(shù)值。這些資源主要包括訓(xùn)練算力、數(shù)據(jù)和推理算力。實(shí)踐表明，投入的資金可以持續(xù)帶來(lái)可預(yù)測(cè)的收益提升；這種scaling law在多個(gè)數(shù)量級(jí)的范圍內(nèi)都保持準(zhǔn)確。

（二）使用特定水平AI的成本每12個(gè)月下降約10倍，較低的價(jià)格又會(huì)帶來(lái)更廣泛的應(yīng)用。這一點(diǎn)可以從2023年初的GPT-4到2024年中的GPT-4o的變化中得到印證，其中每個(gè)token的價(jià)格在這段時(shí)間內(nèi)降低了約150倍。相比之下，摩爾定律以每18個(gè)月翻倍的速度改變了世界，而AI的發(fā)展速度則更為驚人。

（三）智能的線性增長(zhǎng)能帶來(lái)超指數(shù)級(jí)的社會(huì)經(jīng)濟(jì)價(jià)值。因此，我們看不到任何理由認(rèn)為這種指數(shù)級(jí)增長(zhǎng)的投資會(huì)在近期停止。

在山姆·奧特曼的“AI經(jīng)濟(jì)學(xué)”框架中，模型能力的提升與成本的邊際遞減是其核心命題。據(jù)山姆·奧特曼在接受采訪中稱，隨著智能模型固定級(jí)別的智力水平的一旦實(shí)現(xiàn)，其訓(xùn)練成本每年都會(huì)下降約10倍。“這很瘋狂！就像摩爾定律是溫和的改變世界！”山姆·奧特曼感嘆。

不得不說(shuō)，除了其實(shí)踐經(jīng)驗(yàn)，OpenAI最近這關(guān)于開源的最新認(rèn)可，和DeepSeek最近在商業(yè)上的“倒逼”有著直接關(guān)系。開源策略的深層意義，在于構(gòu)建一個(gè)“技術(shù)-數(shù)據(jù)-商業(yè)”的飛輪。

2月17日，DeepSeek正式宣布接入微信并開展灰度測(cè)試。DeepSeek與微信的合作，本質(zhì)是將模型能力嵌入高頻社交場(chǎng)景，獲取海量用戶交互數(shù)據(jù)。

2月3日，DeepSeek官宣與阿里云以及百度智能云聯(lián)合，通過(guò)云服務(wù)觸達(dá)企業(yè)客戶，通過(guò)共享技術(shù)資源、優(yōu)化算法等方式，進(jìn)行生態(tài)共建。

2月初，DeepSeek和三大運(yùn)營(yíng)商達(dá)成戰(zhàn)略合作，實(shí)現(xiàn)AI技術(shù)在通信服務(wù)中的深度融入，這包括網(wǎng)絡(luò)管理、服務(wù)優(yōu)化、用戶體驗(yàn)等多個(gè)維度的突破性進(jìn)展。

1月29日，微軟和DeepSeek共同宣布，DeepSeek-R1已經(jīng)在微軟的AI平臺(tái)Azuer AI Foundry和Github可用，開發(fā)者可以使用新模型進(jìn)行測(cè)試和構(gòu)建基于云的應(yīng)用程序和服務(wù)。

以阿里云為例，其平臺(tái)AI組件產(chǎn)品PAI Model Gallery支持云上一鍵部署DeepSeek系列模型，包括DeepSeek-V3、DeepSeek-R1等。用戶無(wú)需編寫代碼，即可通過(guò)阿里云平臺(tái)實(shí)現(xiàn)模型訓(xùn)練的過(guò)程。值得一提的是， PAI Model Gallery自身是對(duì)阿里云用戶開源的。而PAI Model Gallery的兩種資費(fèi)方式，在線服務(wù)（EAS）計(jì)費(fèi)和分布式訓(xùn)練（DLC）計(jì)費(fèi)，都是根據(jù)用戶實(shí)際使用的資源來(lái)計(jì)算費(fèi)用的，比如按使用時(shí)間或者次數(shù)來(lái)收費(fèi)。這代表了AI開源業(yè)界普遍的一種收費(fèi)模式。

DeepSeek和這些B端企業(yè)的合作模式類似于Android的開源生態(tài)：DeepSeek提供底層模型框架，合作伙伴貢獻(xiàn)場(chǎng)景與數(shù)據(jù)，最終通過(guò)模型迭代實(shí)現(xiàn)“越用越強(qiáng)”的正循環(huán)。

山姆·奧特曼對(duì)AI算力趨勢(shì)的深刻觀察，正體現(xiàn)在DeepSeek 的算力創(chuàng)新中。DeepSeek-V3的崛起——通過(guò)開源模式和技術(shù)創(chuàng)新，將訓(xùn)練成本壓縮至557.6萬(wàn)美元（基于H800 GPU租賃成本計(jì)算），僅為同類閉源模型的1/10甚至更低。這種成本優(yōu)勢(shì)的背后，是算法、框架與硬件的協(xié)同優(yōu)化：FP8混合精度訓(xùn)練使計(jì)算效率提升20%以上，而DeepSeekMoE架構(gòu)以及多頭潛在注意力機(jī)制（MLA）架構(gòu)，通過(guò)細(xì)粒度專家分配，讓每個(gè)Token的激活參數(shù)僅占模型總規(guī)模的5.5%（37B/671B）。

因?yàn)槠漭^低的硬件成本投入，DeepSeek-R1的發(fā)布一度使得英偉達(dá)股價(jià)大跌。但有趣的是，根據(jù)經(jīng)濟(jì)學(xué)杰文斯悖論，算力創(chuàng)新和大幅提升的背后，恰恰會(huì)帶動(dòng)高性能硬件（如英偉達(dá)GPU）的需求并使其可能會(huì)呈現(xiàn)反彈式增長(zhǎng)。

這與杰文斯悖論的核心邏輯相吻合：即技術(shù)進(jìn)步提高了資源利用效率，降低了成本，進(jìn)而刺激了需求增加，最終導(dǎo)致資源消耗總量的上升。

多說(shuō)一句杰文斯悖論：英國(guó)經(jīng)濟(jì)學(xué)家杰文斯發(fā)現(xiàn)，19世紀(jì)中葉，隨著第一次工業(yè)革命工業(yè)化的進(jìn)程，蒸汽機(jī)效率的提升雖然使煤的使用更加經(jīng)濟(jì)，但結(jié)果卻是煤炭的需求飆升。這其實(shí)恰恰滿足了均衡理論中的供需關(guān)系的改變：即價(jià)格降低，勢(shì)必會(huì)帶來(lái)需求量的大幅提升。產(chǎn)品便宜了，買家自然就會(huì)變多。

2月12日，英偉達(dá)在博客中介紹了利用 DeepSeek-R1 和推理時(shí)擴(kuò)展技術(shù)來(lái)自動(dòng)生成優(yōu)化 GPU 內(nèi)核的最新研究成果，效果異常的好。英偉達(dá)表示，其對(duì)于 DeepSeek-R1 的最新進(jìn)展及其應(yīng)用潛力感到非常興奮。

智能的線性增長(zhǎng)能帶來(lái)超指數(shù)級(jí)的社會(huì)經(jīng)濟(jì)價(jià)值。大模型技術(shù)的發(fā)展迭代，必將反哺整個(gè)人工智能和芯片行業(yè)的發(fā)展迭代速率。

這里我們來(lái)具體算一筆賬吧。

賬本落在經(jīng)濟(jì)上，大模型開源，各方怎么個(gè)互惠互利？

一句話：B端（企業(yè)）得到DeepSeek的大模型賦能，C端（用戶）得到B端企業(yè)更好的服務(wù)，而DeepSeek則得到B端企業(yè)的算力和其服務(wù)的C端的用戶和數(shù)據(jù)。

DeepSeek的六萬(wàn)張顯卡投入，這筆重要且巨大的開支，通過(guò)開源，DeepSeek能夠?qū)⑦@些成本分?jǐn)偟秸麄€(gè)生態(tài)系統(tǒng)中。一方面，開源吸引了大量的開發(fā)者和企業(yè)參與到模型的訓(xùn)練和優(yōu)化中，降低了單個(gè)企業(yè)的投入成本，也就是降低了單個(gè)企業(yè)用于構(gòu)建人工智能大模型的邊際費(fèi)用；另一方面，開源也促進(jìn)了DeepSeek技術(shù)的快速迭代和升級(jí)，提高了模型的性能和準(zhǔn)確性，從而降低了后期的維護(hù)成本。此外，通過(guò)與其他企業(yè)的合作，DeepSeek還能夠獲得額外的收入來(lái)源，如技術(shù)授權(quán)、定制化服務(wù)等。

開源代碼不僅降低了DeepSeek自身的開發(fā)成本，還為合作方帶來(lái)了技術(shù)上的節(jié)省成本杠桿。通過(guò)共享代碼和算法，DeepSeek能夠幫助合作方快速構(gòu)建和優(yōu)化自己的AI模型，避免了重復(fù)投入和研發(fā)周期。此外，DeepSeek還提供了豐富的訓(xùn)練數(shù)據(jù)和工具，使得合作方能夠更加高效地訓(xùn)練和優(yōu)化模型。這些節(jié)省下來(lái)的成本，可以成為合作方進(jìn)一步投入AI領(lǐng)域的動(dòng)力。而這一切，也都來(lái)自DeepSeek的模型創(chuàng)新。

自此，不難理解關(guān)于DeepSeek“國(guó)運(yùn)級(jí)應(yīng)用”的評(píng)價(jià)了。

02

都在搞錢，那么DeepSeek的錢怎么搞？

眾所周知，DeepSeek目前是免費(fèi)的，并成功倒逼一眾人工智能大模型公司也隨之宣布其產(chǎn)品未來(lái)免費(fèi)供給C端。

但正如所有企業(yè)都需要營(yíng)利，天下并沒(méi)有免費(fèi)的午餐。DeepSeek的搞錢之道，依然是開源，開源，開源。

其具體邏輯，通過(guò)B端開源技術(shù)降維與生態(tài)鎖定：即用開源代碼降低B端客戶接入門檻，再用增值服務(wù)構(gòu)建自身的壁壘。B端免費(fèi)算力與數(shù)據(jù)反哺：即用對(duì)B端的開源獲取B端免費(fèi)的算力；B端的廣泛覆蓋又反哺C端的全方位覆蓋，從而帶來(lái)更多token樣本（token是數(shù)據(jù)在被模型處理之前或過(guò)程中被分割成的最小單元），大量開源得到的token樣本加成會(huì)使DeepSeep自身模型算力成本大幅降低，算力效率大幅飛躍使自身模型更優(yōu)化，從而又大幅降低自身模型開發(fā)維護(hù)升級(jí)成本。

這種“算力-數(shù)據(jù)-模型”的三角循環(huán)，使得DeepSeek的單位訓(xùn)練成本降低，DeepSeek也正像其無(wú)需人工進(jìn)行標(biāo)注的機(jī)器學(xué)習(xí)模型一樣，可以達(dá)到自學(xué)習(xí)、自維護(hù)、自營(yíng)收益的高效階段。

具體來(lái)說(shuō)，DeepSeek通過(guò)向B端用戶開源其技術(shù)和數(shù)據(jù)資源，吸引他們參與到模型的訓(xùn)練和優(yōu)化中。這些B端用戶可以是企業(yè)、研究機(jī)構(gòu)或開發(fā)者團(tuán)隊(duì)等，他們擁有豐富的數(shù)據(jù)和場(chǎng)景資源，能夠?yàn)槟Ｐ吞峁└佣鄻踊挠?xùn)練樣本和測(cè)試環(huán)境。通過(guò)向這些用戶提供技術(shù)支持，DeepSeek能夠降低大模型的算力成本和提高用戶的參與度。與此同時(shí)，這些B端用戶在使用模型的過(guò)程中也會(huì)產(chǎn)生大量的數(shù)據(jù)和反饋，這些數(shù)據(jù)可以用于進(jìn)一步優(yōu)化模型和提高其性能，促進(jìn)DeepSeek自身模型的快速迭代。這種向B端開源從而獲取算力和數(shù)據(jù)的模式，不僅降低了DeepSeek的運(yùn)營(yíng)成本，還提高了其模型的準(zhǔn)確性和泛化能力。

同時(shí)，隨著B端用戶的不斷增加和深入?yún)⑴c，DeepSeek能覆蓋到更多的C端用戶和應(yīng)用場(chǎng)景。這些C端用戶可以是個(gè)人消費(fèi)者、中小企業(yè)或行業(yè)用戶等，他們對(duì)于智能化需求日益增加。通過(guò)向這些用戶提供智能化的服務(wù)和解決方案，DeepSeek能夠吸引他們參與到模型的訓(xùn)練和優(yōu)化中，從而進(jìn)一步增加Token訓(xùn)練樣本的數(shù)量和多樣性。這些Token訓(xùn)練樣本可以用于進(jìn)一步提高模型的準(zhǔn)確性和泛化能力，從而形成C端對(duì)B端的反哺。

獲得大量開源Token訓(xùn)練樣本能夠降低模型算力成本。DeepSeek利用這些樣本進(jìn)行更加高效的模型訓(xùn)練和優(yōu)化。這種“自迭代”使模型能夠在較少的算力硬件資源下達(dá)到更好的性能表現(xiàn)。這對(duì)于DeepSeek來(lái)說(shuō)自然是一筆巨大的成本節(jié)省。

當(dāng)然，盡管DeepSeek在技術(shù)和應(yīng)用方面已經(jīng)取得了顯著的進(jìn)展，但目前仍然存在一些不完善之處。例如：對(duì)于某些復(fù)雜場(chǎng)景的處理能力有限等問(wèn)題。

而通過(guò)開源策略的實(shí)施和生態(tài)系統(tǒng)的構(gòu)建，DeepSeek正在逐步解決這些問(wèn)題。一方面通過(guò)吸引更多的開發(fā)者和企業(yè)參與到模型的訓(xùn)練和優(yōu)化中來(lái)增加token樣本的數(shù)量和多樣性；另一方面通過(guò)與合作伙伴的開源合作來(lái)拓展應(yīng)用場(chǎng)景和提高模型的泛化能力，充分提升模型處理復(fù)雜場(chǎng)景的能力，正如前文所提到。

DeepSeek的商業(yè)模式，似乎正創(chuàng)新出一條AI公司的“自進(jìn)化”之路。

DeepSeek的商業(yè)模式，本質(zhì)是一場(chǎng)“用模型養(yǎng)模型”的試驗(yàn)：通過(guò)開源吸引生態(tài)伙伴，降低獲客與數(shù)據(jù)獲取成本；再通過(guò)B端增值服務(wù)與C端數(shù)據(jù)價(jià)值變現(xiàn)，支撐算力擴(kuò)容；最后，模型性能提升吸引更多合作伙伴，獲得更多增值收益，形成無(wú)需人工干預(yù)的“數(shù)據(jù)-算力-收益”閉環(huán)。

這一路徑的可行性已初現(xiàn)端倪：DeepSeek-V3的后訓(xùn)練階段僅消耗5K GPU小時(shí)，不到預(yù)訓(xùn)練的0.2%，說(shuō)明模型的自學(xué)習(xí)能力顯著增強(qiáng)。若其能持續(xù)壓縮迭代成本，六萬(wàn)張顯卡的回本周期可能從行業(yè)平均的3-5年縮短至18個(gè)月。