GPT5來(lái)了!奧特曼真聽(tīng)勸,但我擔(dān)心的還是發(fā)生了......
兩年多的時(shí)間,無(wú)數(shù)次的預(yù)告,無(wú)數(shù)次的營(yíng)銷,F(xiàn)在,GPT-5 終于來(lái)了!
這次,奧特曼是真聽(tīng)勸了。以前的 OpenAI 模型命名,像什么 o1、o3、o4、mini、nano、pro...... 看著比奶茶菜單還亂。而現(xiàn)在,它們統(tǒng)一都是 GPT-5?瓷先デ逅瞬簧。
但是大家最期待的那種ChatGPT、Sora式的驚艷技術(shù)大突破,說(shuō)實(shí)話,沒(méi)有......
這也是我所擔(dān)心的點(diǎn)。
1 介紹一下GPT-5
GPT-5 并不是一個(gè)單一模型,而是一個(gè)融合了多個(gè)模型的 “混血系統(tǒng)”。它背后有三種不同層次的模型:
日常應(yīng)答模型:快、準(zhǔn)、便宜,回答大多數(shù)問(wèn)題
深度推理模型:專門解決難題
實(shí)時(shí)路由器:自動(dòng)判斷該用哪個(gè)模型,根據(jù)你的問(wèn)題類型、復(fù)雜度、是否需要工具來(lái)選擇
比如你說(shuō)一句 “這個(gè)題請(qǐng)認(rèn)真推理”,它就會(huì)切換到推理模型。用完配額之后,還有 mini 版本頂上。
這是 GPT-5 真正的殺手锏,代表它已經(jīng)具備非常成熟的工具和模型調(diào)用能力。
API 端也很簡(jiǎn)單,直接分成三個(gè)型號(hào):
gpt-5(主力)
gpt-5-mini(輕量)
gpt-5-nano(極輕量)
每個(gè)型號(hào)還能設(shè)置 4 個(gè)推理等級(jí)。最特別的是增加了一個(gè) “minimal模式”,不繞彎子、不浪費(fèi)推理 token,直接提高響應(yīng)速度。
此外,GPT-5 支持超長(zhǎng)上下文,以及雙模輸入:
輸入上限:272,000 tokens
輸出上限(含推理 token):128,000 tokens
支持“文本+圖片”輸入,輸出只支持文本
這意味著它能一口氣消化上百頁(yè)文檔,相當(dāng)于一本巨著,還能邊看圖邊理解,再用相當(dāng)長(zhǎng)的篇幅給你答復(fù)。
2 GPT-5確實(shí)更聰明了
OpenAI說(shuō),GPT-5的推理能力提升了,還更誠(chéng)實(shí)、更少幻覺(jué),在寫(xiě)作、編程、醫(yī)療等領(lǐng)域都比前代強(qiáng)。奧特曼自信地說(shuō):
“GPT-3有點(diǎn)像和高中生交談。GPT-4,也許就像和大學(xué)生交談一樣。但有了GPT-5,現(xiàn)在就像和一位專家交談,一位博士級(jí)別的專家,在任何你需要的領(lǐng)域,按需交流。”
聽(tīng)起來(lái)很燃,但一些早期體驗(yàn)者給出的評(píng)價(jià)是:它很穩(wěn),很能干,但不是質(zhì)變。
特別是在寫(xiě)作上,甚至有人覺(jué)得GPT-4.5的文字風(fēng)格更貼近人類,而GPT-5偶爾還是會(huì)冒出“套話式”的流水文。
不過(guò)在編程方面,GPT-5的口碑倒是相當(dāng)炸裂。
從一口氣生成整個(gè)網(wǎng)站,到精準(zhǔn)解決復(fù)雜依賴沖突,它比任何前代模型都干脆利落,能用并行調(diào)用多個(gè)工具,像個(gè)人類程序員一樣干活。
OpenAI官網(wǎng)甚至展示了GPT-5生成的小游戲,直接可以玩的那種,以及對(duì)應(yīng)Prompt。
下面我們看一下 GPT-5 的成績(jī)單:
數(shù)學(xué):AIME 2025(無(wú)工具輔助)得分 94.6% 。
編程:SWEbench Verified 得分 74.9%,Aider Polyglot 得分 88% 。
多模態(tài)理解:在 MMMU 上取得 84.2% 。
健康領(lǐng)域:HealthBench Hard 得分 46.2% 。
經(jīng)濟(jì)重要任務(wù):在涵蓋法律、物流、銷售和工程等 40 多個(gè)職業(yè)的任務(wù)中,其表現(xiàn)優(yōu)于 o3 和 ChatGPT Agent。
推理能力:在 GPQA(面向研究生水平的科學(xué)問(wèn)題)上也創(chuàng)下新記錄,無(wú)工具情況下取得 88.4% 的高分。
3 價(jià)格打骨折
這次的定價(jià)直接開(kāi)卷:
GPT-5:輸入 $1.25/百萬(wàn)token;輸出 $10/百萬(wàn)token
GPT-5 Mini:輸入 $0.25/百萬(wàn)token;輸出 $2/百萬(wàn)token
GPT-5 Nano:輸入 $0.05/百萬(wàn)token;輸出 $0.4/百萬(wàn)token
GPT-5 的價(jià)格比 GPT-4o 便宜一半,再加上90%的緩存折扣(短時(shí)間重復(fù)用相同輸入時(shí)),做AI產(chǎn)品的成本能省一大截。
和同類Claude、Gemini、Grok比起來(lái),價(jià)格優(yōu)勢(shì)明顯。OpenAI這是要赤裸裸地?fù)屖袌?chǎng)。
4 更安全可靠,從“拒絕”到“安全回答”
以前 AI 要么直接回答你,要么一句“抱歉不能回答”。
GPT-5 用了新的 safe-completions 策略:在安全政策范圍內(nèi)盡量給出高層次、有用的答案,而不是簡(jiǎn)單拒絕。
其他改進(jìn)包括:
降低幻覺(jué)率:尤其是無(wú)聯(lián)網(wǎng)時(shí)的事實(shí)錯(cuò)誤
減少諂媚傾向:通過(guò)獎(jiǎng)勵(lì)機(jī)制減少它盲目迎合用戶
承認(rèn)做不到:遇到無(wú)法完成的任務(wù),會(huì)明確告訴你,而不是裝作完成了
在外部紅隊(duì)的 Prompt Injection 測(cè)試中,GPT-5-thinking 在攻擊成功率上只有 56.8%(k=10),明顯好于其他主流模型,但也說(shuō)明這問(wèn)題還沒(méi)解決,超過(guò)一半的多次嘗試仍然能突破防線。
5 GPT-5的發(fā)布時(shí)機(jī)
這次發(fā)布的時(shí)機(jī)非常 “奧特曼”:
谷歌剛發(fā) Gemini Pro 1.5,他立刻甩出 GPT-5 搶頭條
一口氣覆蓋免費(fèi)到 $200/月全價(jià)位用戶
同步進(jìn)駐微軟全家桶(Copilot、Azure AI)
這不僅是技術(shù)迭代和價(jià)格戰(zhàn),更是生態(tài)戰(zhàn):讓所有用戶和開(kāi)發(fā)者在 GPT-5 體系里閉環(huán),不給競(jìng)品留空間。
6 沒(méi)有突破性技術(shù),AI進(jìn)入瓶頸期?
別看這次 GPT-5 發(fā)布得聲勢(shì)浩大,價(jià)格表甩得啪啪響,性能數(shù)據(jù)擺得整整齊齊,但如果你把興奮勁壓下來(lái),就會(huì)發(fā)現(xiàn)一個(gè)殘酷事實(shí):
這次的內(nèi)核,并沒(méi)有任何真正的 “質(zhì)變”技術(shù)突破。
它的推理能力更強(qiáng)、上下文更大、工具用得更靈活,這些進(jìn)步本質(zhì)上都是在現(xiàn)有LLM架構(gòu)下的堆料與優(yōu)化。
而這恰恰暴露了一個(gè)可能讓整個(gè)行業(yè)都不安的信號(hào):
我們是不是已經(jīng)接近了這一代 AI 技術(shù)的 “天花板” ?
想想看,過(guò)去兩年里,AI 大模型的驚艷時(shí)刻幾乎都發(fā)生在 2022-2023:ChatGPT 橫空出世、GPT-4 讓人驚掉下巴、Stable Diffusion 把圖像生成送到民用級(jí)別、Midjourney 的畫(huà)風(fēng)一度封神。
可到了 2024-2025,這些新品的“驚喜值”明顯下降,發(fā)布會(huì)更多是在講降價(jià)、整合、生態(tài),而不是在炫耀什么 “完全新的智能范式”。
而且,目前大模型的訓(xùn)練成本依然高得難以落地,性能提升卻越來(lái)越依賴于數(shù)據(jù)清洗、推理策略優(yōu)化這種 “精裝修” 工作,而不是地基上的革命。
這可能意味著:
下一代質(zhì)變可能需要全新的架構(gòu)突破,而不是繼續(xù)把 Transformer 喂到天荒地老。
當(dāng)前的 LLM,很可能已經(jīng)到了一個(gè)短期內(nèi)難以跨越的瓶頸期,我們不知道這個(gè)瓶頸會(huì)持續(xù)一年,還是五年。
換句話說(shuō),GPT-5 是一次優(yōu)秀的迭代,但它的意義更像是 “蘋(píng)果把 iPhone 15 做到了極致”,而不是 “喬布斯第一次拿出 iPhone ”。
對(duì)于GPT-5,你是驚喜呢?還是失望呢?
歡迎在評(píng)論區(qū)討論!
原文標(biāo)題 : GPT5來(lái)了!奧特曼真聽(tīng)勸,但我擔(dān)心的還是發(fā)生了......

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
精彩回顧立即查看>> 【在線研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車出海美國(guó)
- 2 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 3 阿里首位程序員,“掃地僧”多隆已離職
- 4 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來(lái)新一輪協(xié)同進(jìn)化
- 5 六大國(guó)產(chǎn)大模型,誰(shuí)是最強(qiáng)“金融分析師”?|錦緞評(píng)測(cè)
- 6 2025年第一支10倍股,來(lái)了!
- 7 募資39.85億元!寒武紀(jì)押注大模型芯片與軟件平臺(tái)
- 8 國(guó)內(nèi)免費(fèi)版Deep Research上線,秘塔AI深度研究嘗試重塑知識(shí)工作范式
- 9 清庫(kù)存?曝英偉達(dá)H20供應(yīng)有限,且沒(méi)有復(fù)產(chǎn)計(jì)劃
- 10 賈躍亭再獲 7.5 億元融資,用于新車FF 91 生產(chǎn)交付