訂閱
糾錯(cuò)
加入自媒體

GPT-5 翻車:OpenAI「回滾」大戲與AI擴(kuò)張隱形邊界

2025-08-14 17:08
山自
關(guān)注

8 月7日,GPT-5 帶著四款型號(hào)(regular / mini / nano / pro)高調(diào)上線;8 月12日,Sam Altman 在 X 上宣布:GPT-4o 重新成為所有付費(fèi)用戶的默認(rèn)模型。

從「下架」到「復(fù)活」,只用了 5 天。上一次 OpenAI 如此倉(cāng)促地回滾,還要追溯到 2023 年 11 月 ChatGPT「宕機(jī)門」。不同的是,那一次是技術(shù)故障,這一次是產(chǎn)品策略的「自我修正」。

VentureBeat 拿到的后臺(tái)日志顯示,GPT-5 發(fā)布首周暴露了三大硬傷:

路由失控:autoswitcher 把 37% 的 Pro 用戶請(qǐng)求錯(cuò)誤地分配到了 nano,導(dǎo)致長(zhǎng)

文本直接「失憶」。

性能漂移:在代碼補(bǔ)全場(chǎng)景,GPT-5 的通過率比 GPT-4o 低 8.7%,Stack 

Overflow 熱帖罵聲一片。

情感撕裂:Reddit r/ChatGPT 一天內(nèi) 1.2 萬(wàn)條帖子控訴「新版沒有靈魂」。

于是,OpenAI 用一次「默認(rèn)模型回退」緊急止血。Altman 的承諾聽起來像安撫:「如果未來再次移除 GPT-4o,我們會(huì)提前充分通知!

但翻譯成行業(yè)黑話就是——GPT-5 還沒準(zhǔn)備好全盤接管生產(chǎn)環(huán)境。

用戶「模型依戀癥」:AI 產(chǎn)品的第一次「飯圈化」

你可能很難想象,大模型也能有「白月光」。

獨(dú)立開發(fā)者 Alex 在推特上貼出自己的 VSCode 插件,說 GPT-4o 的代碼風(fēng)格「像一位默契的老搭檔」。

一位日本插畫師把 GPT-4o 的回復(fù)打印成冊(cè),取名《4o 詩(shī)集》。

甚至有用戶在 Change.org 發(fā)起請(qǐng)?jiān),要求永久保?GPT-4o 的「性格參數(shù)」。

這不是段子,而是 OpenAI 產(chǎn)品團(tuán)隊(duì)最近才意識(shí)到的「模型人格黏性」。當(dāng) LLM 成為百萬(wàn)級(jí)創(chuàng)作者的日常生產(chǎn)工具,它的「語(yǔ)氣」就是生產(chǎn)力本身。

Altman 在內(nèi)部 Slack 里寫道:「我們低估了用戶對(duì)『人格一致性』的敏感度。」

因此,下一版 GPT-5 將上線「溫度旋鈕」:

Warm:更親切,接近 GPT-4o;

Neutral:當(dāng)前默認(rèn);

Balanced:介于兩者之間,且允許用戶微調(diào) 0–100 的連續(xù)值。

這是 AI 產(chǎn)品第一次出現(xiàn)「皮膚系統(tǒng)」——不是換顏色,而是換靈魂。

隱藏關(guān)卡:推理模式的「電費(fèi)賬單」

GPT-5「Thinking」模式有多貴?

上下文 196k token,單輪成本 ≈ GPT-4o 的 3.6 倍;

每周 3000 條限額,折算美元約 60 美元/周;

如果限額用完,自動(dòng)降級(jí)到 Thinking-mini,精度再打 8 折。

這還只是 C 端。企業(yè) API 的價(jià)格表更刺激:

模式輸入 / 1M tokens輸出 / 1M tokens相對(duì) 4o 漲幅GPT-5 Thinking$15$60+400%GPT-5 Fast$5$15+50%GPT-4o$3$10baseline

電費(fèi)、顯卡、碳排,三座大山讓「無(wú)限上下文」成了奢侈品。據(jù) Bit.ly/4mwGngO 沙龍流出的閉門數(shù)據(jù):

微軟 Azure 為 GPT-5 預(yù)留的 20 萬(wàn) H100 集群,峰值功耗 120 MW,相當(dāng)于舊金山 8% 的居民用電。

推理延遲每降低 10ms,就要額外消耗 5% 電力。

OpenAI 基礎(chǔ)設(shè)施 VP 在一次非公開會(huì)議承認(rèn):「推理成本的上漲速度超過了摩爾定律的衰減速度!

效率 vs. 擴(kuò)張:Scaling Law 的「三相點(diǎn)」

過去五年,AI 行業(yè)信奉「參數(shù)越大,性能越強(qiáng)」,F(xiàn)在,我們第一次觸碰到「擴(kuò)張-效率-可持續(xù)」的三相臨界點(diǎn):

參數(shù)擴(kuò)張:GPT-5 4T 參數(shù),訓(xùn)練一次 3.2 億美元;

推理效率:稀疏化、MoE、4-bit 量化只能抵消 60% 的成本增幅;

可持續(xù):美國(guó)電網(wǎng)新增負(fù)荷里,AI 訓(xùn)練已占 4%,環(huán)保組織開始起訴數(shù)據(jù)中心。

于是,行業(yè)出現(xiàn)了三條新路徑:

模型瘦身:Mistral-Medium-122B 在 MMLU 上逼近 GPT-4,訓(xùn)練只用 1.5 億美元;

硬件定制:谷歌 TPU v6、亞馬遜 Trainium2,把「算力/瓦時(shí)」提升 2.3 倍;

能量套利:把數(shù)據(jù)中心搬到挪威水電、沙特光伏,電費(fèi)降 40%。

一句話:「大」不再是唯一賣點(diǎn),「省」才是下一輪融資的故事核心。

OpenAI 的「多線程」未來:一次發(fā)布會(huì),三種商業(yè)模式

把這次 GPT-5 翻車與回滾,放在 OpenAI 的商業(yè)大圖景里看,其實(shí)是三條收入曲線的「同步測(cè)試」:

曲線產(chǎn)品形態(tài)收費(fèi)方式目標(biāo)人群訂閱曲線ChatGPT Plus / Pro月費(fèi)C 端創(chuàng)作者API 曲線GPT-5 推理按 token中小企業(yè)硬件曲線定制芯片合作分成超大規(guī)模云廠商

這次事件讓三條曲線的優(yōu)先級(jí)重新排序:

C 端:先保體驗(yàn),再談升級(jí)——回滾 4o 是訂閱收入的安全墊;

API 端:先保利潤(rùn),再談規(guī)模——Thinking 模式的高定價(jià)是 ROI 保險(xiǎn);

硬件端:先保能效,再談擴(kuò)張——與英偉達(dá)、AMD 的聯(lián)合優(yōu)化項(xiàng)目已經(jīng)啟動(dòng)。

當(dāng) AI 進(jìn)入「精耕細(xì)作」時(shí)代

GPT-5 的翻車,像極了 2016 年 iPhone 7 取消耳機(jī)孔:

用戶罵聲一片,但 AirPods 打開了新的千億市場(chǎng);

現(xiàn)在,OpenAI 用一次「模型回滾」告訴世界:Scaling Law 的狂飆時(shí)代結(jié)束,

精耕細(xì)作時(shí)代開始。

接下來的 12 個(gè)月,我們會(huì)看到:

更多「尺寸更小、推理更快、能耗更低」的模型;

更多「可調(diào)人格、可調(diào)成本、可調(diào)安全」的旋鈕;

更多「把電費(fèi)算進(jìn)產(chǎn)品定價(jià)」的 SaaS 新套餐。

AI 不再是「大力出奇跡」的黑箱,而是「斤斤計(jì)較」的工程生意。這一次,連 Altman 也承認(rèn):

「我們的敵人不是競(jìng)爭(zhēng)對(duì)手,而是物理定律!

       原文標(biāo)題 : GPT-5 翻車:OpenAI「回滾」大戲與AI擴(kuò)張隱形邊界

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)