OpenAl終于出手!官宣開源新模型,這次是摸著 Deepseek過河
編輯:Yuki | ID:YukiYuki1108
在暗示推出一款開源模型的一個(gè)多月后(2025年4月1日),OpenAI CEO山姆·奧特曼(Sam Altman)在社交平臺(tái)X上正式宣布:OpenAI計(jì)劃在未來幾個(gè)月內(nèi)發(fā)布一款具備推理能力的“開放權(quán)重”(open-weight)大模型。這一消息迅速引發(fā)了科技媒體和行業(yè)觀察者的廣泛關(guān)注。許多中文媒體以“OpenAI預(yù)告/即將發(fā)布開源模型”為標(biāo)題進(jìn)行報(bào)道;一些業(yè)內(nèi)人士則將其視為OpenAI重新走向開源的標(biāo)志性一步。
然而,“開放權(quán)重”是否等同于“開源”?這一問題的答案并不簡(jiǎn)單。從OpenAI的措辭
到行業(yè)實(shí)踐,“開放權(quán)重”與“開源”之間存在著顯著差異。本文將深入探討這一話題。
一、“開放權(quán)重”與“開源”:概念辨析
首先需要明確的是,“開放權(quán)重”(open-weight)與“開源”(open-source)是兩個(gè)不同的概念。
“開放權(quán)重”:指的是在模型訓(xùn)練完成后公開其參數(shù)(weights),允許開發(fā)者基于這些參數(shù)進(jìn)行部署、測(cè)試甚至微調(diào)。然而,“開放權(quán)重”并不包括訓(xùn)練數(shù)據(jù)、完整訓(xùn)練代碼或明確的使用權(quán)限。這意味著開發(fā)者可以利用這些參數(shù)進(jìn)行本地部署和推理服務(wù)(如對(duì)話生成或文本分類),但無法復(fù)現(xiàn)完整的訓(xùn)練過程或完全自由地修改模型的底層架構(gòu)。
“開源”:則是一個(gè)更廣泛的概念。它不僅包括代碼公開(如訓(xùn)練代碼和推理代碼),還可能涉及訓(xùn)練數(shù)據(jù)、方法透明性以及使用權(quán)限的自由度。開源的核心理念是全面透明和自由使用。
從這個(gè)角度來看,“開放權(quán)重”更像是開源的一個(gè)子集——它降低了模型的使用門檻(如本地部署和微調(diào)),但無法滿足真正的可驗(yàn)證性與可重現(xiàn)性需求。
二、行業(yè)實(shí)踐:“開放權(quán)重”已成為主流
盡管“開放權(quán)重”與“開源”存在差異(如缺少訓(xùn)練數(shù)據(jù)和完整
訓(xùn)練代碼),但從行業(yè)實(shí)踐來看,“開放權(quán)重”已經(jīng)成為當(dāng)前大模型的主流模式。
以DeepSeek、Qwen(阿里)和LLaMA(Meta)為例:
DeepSeek:其V2、V3和R1等系列均采用了“開放權(quán)重”策略。此外DeepSeek還提供了技術(shù)報(bào)告并采用了限制極少的MIT開源協(xié)議——允許任何人自由地使用、修改、分發(fā)和商業(yè)化軟件或模型。
Qwen(阿里):Qwen系列不僅公開了權(quán)重還采用了Apache2.0協(xié)議——允許用戶自由地使用修改分發(fā)代碼包括商業(yè)用途僅要求保留原始版權(quán)聲明許可聲明。
LLaMA(Meta):雖然LLaMA系列也公開了參數(shù)推理腳本但其使用協(xié)議限制更多從LLaMA2開始Meta采用了更寬松許可證(LLaMA3又更開放了一點(diǎn))但仍需申請(qǐng)使用且不能直接用于某些商業(yè)應(yīng)用發(fā)布服務(wù)導(dǎo)致其落地場(chǎng)景受限。
這些案例表明盡管三者都自稱“開源”,但如果將“開源”拆解為幾個(gè)維度來看——如是否公開完整訓(xùn)練數(shù)據(jù)是否提供可復(fù)現(xiàn)訓(xùn)練代碼等——你會(huì)發(fā)現(xiàn)沒有一家是真正意義上做到全開。
三、“o3-mini級(jí)別”:OpenAI新模型的定位
根據(jù)Sam Altman在今年2月的暗示以及最新推文中提到的“powerful new open-weight model with reasoning”,可以推測(cè)出OpenAI在開源路線上最終選擇了一個(gè)“o3-mini級(jí)別”的推理型大語言來打開局面。
所謂“o3-mini級(jí)別”,指的是具備較強(qiáng)推理能力且適合輕量化部署的中小型大語言——這類既能夠滿足企業(yè)級(jí)應(yīng)用需求又能夠降低硬件成本使其成為當(dāng)前市場(chǎng)上最受歡迎類型之一。
四、“重返”還是“妥協(xié)”?
對(duì)于OpenAI來說這次重返社區(qū)意義遠(yuǎn)不止發(fā)布那么簡(jiǎn)單過去兩年間Meta Mistral Qwen DeepSeek輪番上場(chǎng)一邊打造一邊打造生態(tài)甚至逐漸形成規(guī)模龐大生態(tài)尤其在DeepSeek-V3/R1之后越來越多硬件軟件廠商加入其中使得整個(gè)行業(yè)格局發(fā)生顯著變化而作為曾經(jīng)引領(lǐng)者卻因閉源策略逐漸被邊緣化因此這次部分回歸可以看作是對(duì)競(jìng)爭(zhēng)壓力回應(yīng)同時(shí)也是對(duì)自身定位調(diào)整。
五、“真開”還是“假開”?
盡管很多人以為是以起家但實(shí)際上至少在GPT-2時(shí)期就有了閉源路線打算2019年初GPT-2發(fā)布開始以惡意使用風(fēng)險(xiǎn)名義拒絕公開但在外界一致認(rèn)為夸大風(fēng)險(xiǎn)輿論下才在年底公開滿血版15億參數(shù)GPT-2不論如何從GPT-3開始徹底走上閉源路線不再公開權(quán)重代碼或訓(xùn)練數(shù)據(jù)因此這一次重新也可以視為對(duì)社區(qū)釋放信號(hào)但需要明確是從Sam Altman采用字眼來看大概率將和今天DeepSeek Qwen LLaMA一樣:
優(yōu)點(diǎn):降低門檻支持本地部署微調(diào)適配缺點(diǎn):無法復(fù)現(xiàn)完整過程難以滿足真正需求
原文標(biāo)題 : OpenAl終于出手!官宣開源新模型,這次是摸著 Deepseek過河

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國跨境支付十大趨勢(shì)
- 5 中國最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 7 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 張勇等人退出阿里合伙人
- 10 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市