中文字幕熟妇在线观看,91精品人妻一区二区

當(dāng)前位置： OFweek 人工智能網(wǎng) > 機(jī)器學(xué)習(xí) > 正文

GPT5來了！奧特曼真聽勸，但我擔(dān)心的還是發(fā)生了......

2025-08-14 16:47

AI機(jī)器人茶館

關(guān)注

兩年多的時(shí)間，無數(shù)次的預(yù)告，無數(shù)次的營(yíng)銷。現(xiàn)在，GPT-5 終于來了！

這次，奧特曼是真聽勸了。以前的 OpenAI 模型命名，像什么 o1、o3、o4、mini、nano、pro...... 看著比奶茶菜單還亂。而現(xiàn)在，它們統(tǒng)一都是 GPT-5�？瓷先デ逅瞬簧�。

但是大家最期待的那種ChatGPT、Sora式的驚艷技術(shù)大突破，說實(shí)話，沒有......

這也是我所擔(dān)心的點(diǎn)。

1 介紹一下GPT-5

GPT-5 并不是一個(gè)單一模型，而是一個(gè)融合了多個(gè)模型的 “混血系統(tǒng)”。它背后有三種不同層次的模型：

日常應(yīng)答模型：快、準(zhǔn)、便宜，回答大多數(shù)問題

深度推理模型：專門解決難題

實(shí)時(shí)路由器：自動(dòng)判斷該用哪個(gè)模型，根據(jù)你的問題類型、復(fù)雜度、是否需要工具來選擇

比如你說一句 “這個(gè)題請(qǐng)認(rèn)真推理”，它就會(huì)切換到推理模型。用完配額之后，還有 mini 版本頂上。

這是 GPT-5 真正的殺手锏，代表它已經(jīng)具備非常成熟的工具和模型調(diào)用能力。

API 端也很簡(jiǎn)單，直接分成三個(gè)型號(hào)：

gpt-5（主力）

gpt-5-mini（輕量）

gpt-5-nano（極輕量）

每個(gè)型號(hào)還能設(shè)置 4 個(gè)推理等級(jí)。最特別的是增加了一個(gè) “minimal模式”，不繞彎子、不浪費(fèi)推理 token，直接提高響應(yīng)速度。

此外，GPT-5 支持超長(zhǎng)上下文，以及雙模輸入：

輸入上限：272,000 tokens

輸出上限（含推理 token）：128,000 tokens

支持“文本+圖片”輸入，輸出只支持文本

這意味著它能一口氣消化上百頁文檔，相當(dāng)于一本巨著，還能邊看圖邊理解，再用相當(dāng)長(zhǎng)的篇幅給你答復(fù)。

2 GPT-5確實(shí)更聰明了

OpenAI說，GPT-5的推理能力提升了，還更誠(chéng)實(shí)、更少幻覺，在寫作、編程、醫(yī)療等領(lǐng)域都比前代強(qiáng)。奧特曼自信地說：

“GPT-3有點(diǎn)像和高中生交談。GPT-4，也許就像和大學(xué)生交談一樣。但有了GPT-5，現(xiàn)在就像和一位專家交談，一位博士級(jí)別的專家，在任何你需要的領(lǐng)域，按需交流。”

聽起來很燃，但一些早期體驗(yàn)者給出的評(píng)價(jià)是：它很穩(wěn)，很能干，但不是質(zhì)變。

特別是在寫作上，甚至有人覺得GPT-4.5的文字風(fēng)格更貼近人類，而GPT-5偶爾還是會(huì)冒出“套話式”的流水文。

不過在編程方面，GPT-5的口碑倒是相當(dāng)炸裂。

從一口氣生成整個(gè)網(wǎng)站，到精準(zhǔn)解決復(fù)雜依賴沖突，它比任何前代模型都干脆利落，能用并行調(diào)用多個(gè)工具，像個(gè)人類程序員一樣干活。

OpenAI官網(wǎng)甚至展示了GPT-5生成的小游戲，直接可以玩的那種，以及對(duì)應(yīng)Prompt。

下面我們看一下 GPT-5 的成績(jī)單：

數(shù)學(xué)：AIME 2025（無工具輔助）得分 94.6% 。

編程：SWEbench Verified 得分 74.9%，Aider Polyglot 得分 88% 。

多模態(tài)理解：在 MMMU 上取得 84.2% 。

健康領(lǐng)域：HealthBench Hard 得分 46.2% 。

經(jīng)濟(jì)重要任務(wù)：在涵蓋法律、物流、銷售和工程等 40 多個(gè)職業(yè)的任務(wù)中，其表現(xiàn)優(yōu)于 o3 和 ChatGPT Agent。

推理能力：在 GPQA（面向研究生水平的科學(xué)問題）上也創(chuàng)下新記錄，無工具情況下取得 88.4% 的高分。

3 價(jià)格打骨折

這次的定價(jià)直接開卷：

GPT-5：輸入 $1.25/百萬token；輸出 $10/百萬token

GPT-5 Mini：輸入 $0.25/百萬token；輸出 $2/百萬token

GPT-5 Nano：輸入 $0.05/百萬token；輸出 $0.4/百萬token

GPT-5 的價(jià)格比 GPT-4o 便宜一半，再加上90%的緩存折扣（短時(shí)間重復(fù)用相同輸入時(shí)），做AI產(chǎn)品的成本能省一大截。

和同類Claude、Gemini、Grok比起來，價(jià)格優(yōu)勢(shì)明顯。OpenAI這是要赤裸裸地?fù)屖袌?chǎng)。

4 更安全可靠，從“拒絕”到“安全回答”

以前 AI 要么直接回答你，要么一句“抱歉不能回答”。

GPT-5 用了新的 safe-completions 策略：在安全政策范圍內(nèi)盡量給出高層次、有用的答案，而不是簡(jiǎn)單拒絕。

其他改進(jìn)包括：

降低幻覺率：尤其是無聯(lián)網(wǎng)時(shí)的事實(shí)錯(cuò)誤

減少諂媚傾向：通過獎(jiǎng)勵(lì)機(jī)制減少它盲目迎合用戶

承認(rèn)做不到：遇到無法完成的任務(wù)，會(huì)明確告訴你，而不是裝作完成了

在外部紅隊(duì)的 Prompt Injection 測(cè)試中，GPT-5-thinking 在攻擊成功率上只有 56.8%（k=10），明顯好于其他主流模型，但也說明這問題還沒解決，超過一半的多次嘗試仍然能突破防線。

5 GPT-5的發(fā)布時(shí)機(jī)

這次發(fā)布的時(shí)機(jī)非常 “奧特曼”：

谷歌剛發(fā) Gemini Pro 1.5，他立刻甩出 GPT-5 搶頭條

一口氣覆蓋免費(fèi)到 $200/月全價(jià)位用戶

同步進(jìn)駐微軟全家桶（Copilot、Azure AI）

這不僅是技術(shù)迭代和價(jià)格戰(zhàn)，更是生態(tài)戰(zhàn)：讓所有用戶和開發(fā)者在 GPT-5 體系里閉環(huán)，不給競(jìng)品留空間。

6 沒有突破性技術(shù)，AI進(jìn)入瓶頸期？

別看這次 GPT-5 發(fā)布得聲勢(shì)浩大，價(jià)格表甩得啪啪響，性能數(shù)據(jù)擺得整整齊齊，但如果你把興奮勁壓下來，就會(huì)發(fā)現(xiàn)一個(gè)殘酷事實(shí)：

這次的內(nèi)核，并沒有任何真正的 “質(zhì)變”技術(shù)突破。

它的推理能力更強(qiáng)、上下文更大、工具用得更靈活，這些進(jìn)步本質(zhì)上都是在現(xiàn)有LLM架構(gòu)下的堆料與優(yōu)化。

而這恰恰暴露了一個(gè)可能讓整個(gè)行業(yè)都不安的信號(hào)：

我們是不是已經(jīng)接近了這一代 AI 技術(shù)的 “天花板” ？

想想看，過去兩年里，AI 大模型的驚艷時(shí)刻幾乎都發(fā)生在 2022-2023：ChatGPT 橫空出世、GPT-4 讓人驚掉下巴、Stable Diffusion 把圖像生成送到民用級(jí)別、Midjourney 的畫風(fēng)一度封神。

可到了 2024-2025，這些新品的“驚喜值”明顯下降，發(fā)布會(huì)更多是在講降價(jià)、整合、生態(tài)，而不是在炫耀什么 “完全新的智能范式”。

而且，目前大模型的訓(xùn)練成本依然高得難以落地，性能提升卻越來越依賴于數(shù)據(jù)清洗、推理策略優(yōu)化這種 “精裝修” 工作，而不是地基上的革命。

這可能意味著：

下一代質(zhì)變可能需要全新的架構(gòu)突破，而不是繼續(xù)把 Transformer 喂到天荒地老。

當(dāng)前的 LLM，很可能已經(jīng)到了一個(gè)短期內(nèi)難以跨越的瓶頸期，我們不知道這個(gè)瓶頸會(huì)持續(xù)一年，還是五年。

換句話說，GPT-5 是一次優(yōu)秀的迭代，但它的意義更像是 “蘋果把 iPhone 15 做到了極致”，而不是 “喬布斯第一次拿出 iPhone ”。

對(duì)于GPT-5，你是驚喜呢？還是失望呢？

歡迎在評(píng)論區(qū)討論！

原文標(biāo)題 : GPT5來了！奧特曼真聽勸，但我擔(dān)心的還是發(fā)生了......

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無評(píng)論

圖片新聞

推薦商品