ChatGPT-5 來了:從狂熱贊美到理性質(zhì)疑
文 / 二風
來源 / 節(jié)點財經(jīng)
北京時間8月8日凌晨,OpenAI正式向全球發(fā)布其最新旗艦模型GPT-5,這一被寄予厚望的人工智能系統(tǒng)在經(jīng)歷兩次跳票后終于面世。
OpenAI首席執(zhí)行官薩姆·奧爾特曼(Sam Altman)形容,和GPT-5溝通,就像是在和一位在任何領(lǐng)域隨時待命的博士級專家對話,不僅會聊天,更能幫助你實現(xiàn)任何目標。‘
而對前代模型,他也做了類似的比喻,比如和GPT-3溝通,更像和高中生交談,偶然靈感迸發(fā)但惱人的地方也不少;而GPT-4o更像是一位大學生,兼具了智能和實用性。
《節(jié)點財經(jīng)》認為,作為OpenAI迄今為止"最智能"的模型,GPT-5的發(fā)布標志著該公司在技術(shù)競爭中的重要一步,更預示著整個AI行業(yè)正在從追求突破性創(chuàng)新轉(zhuǎn)向產(chǎn)品精細化和商業(yè)化落地的新階段。
根據(jù)OpenAI官方數(shù)據(jù),GPT-5已向全球超過7億活躍用戶開放使用。然而,與市場預期的"顛覆性革命"不同,GPT-5更像是一次精心打磨的產(chǎn)品升級,體現(xiàn)出AI行業(yè)正在進入一個更加務(wù)實的發(fā)展階段。
01 GPT-5新在哪兒?
GPT-5最亮眼的技術(shù)創(chuàng)新在于"統(tǒng)一路由系統(tǒng)"架構(gòu)。
簡而言之,相比于前代需要用戶手動在5-6個模型中根據(jù)需求自行選擇,GPT-5可自動在快速響應模式和深度推理模式之間切換,無需用戶手動選擇。據(jù)OpenAI官方介紹,這種架構(gòu)設(shè)計讓GPT-5能夠"像專家一樣思考,像朋友一樣交流"。
OpenAI首席執(zhí)行官薩姆·奧爾特曼
在技術(shù)指標方面,GPT-5展現(xiàn)出顯著的性能提升。根據(jù)OpenAI發(fā)布的系統(tǒng)卡片,該模型在SWE-bench編程基準測試中取得了74.9%的得分,略微超越了Anthropic最新發(fā)布的Claude Opus 4.1的74.5%。在準確性方面,GPT-5的幻覺率相比前代GPT-4o降低了45%,特別是在健康醫(yī)療領(lǐng)域的查詢中,錯誤率從GPT-4o的12.9%大幅降至1.6%,這一改進對于醫(yī)療AI應用具有重要意義。
東吳證券的研究報告估算,GPT-5可能擁有高達18萬億個參數(shù),訓練周期約為203-225天,訓練成本超過5億美元。
《節(jié)點財經(jīng)》分析,巨大的投入反映出當前AI大模型開發(fā)的資本密集特性,也預示著未來AI基礎(chǔ)設(shè)施投資將迎來新一輪浪潮。
OpenAI也為GPT-5設(shè)計了一套頗為精細的差異化服務(wù)體系,針對不同用戶提供不同級別的訪問權(quán)限和功能。
對于免費用戶,提供每5小時10條消息的基礎(chǔ)額度,每日可使用一次GPT-5的深度推理模式。Plus訂閱用戶(月費20美元)每3小時獲得80條消息額度,每周可使用200次深度推理模式。Pro專業(yè)用戶(月費200美元)則享受幾乎無限制的訪問權(quán)限,這一高端定價瞄準的是對AI工具有深度依賴的專業(yè)人士和創(chuàng)作者。據(jù)CNBC報道,OpenAI預計Pro用戶將主要來自軟件開發(fā)、數(shù)據(jù)分析、內(nèi)容創(chuàng)作等領(lǐng)域。
GPT-5上架GitHub Copilot
在API定價方面,GPT-5選擇了性價比頗高的競爭策略,每百萬輸入token定價1.25美元,輸出token定價10美元,這一價格相比Claude 3.5 Sonnet的3美元輸入/15美元輸出具有明顯優(yōu)勢。這種激進的定價策略,也反映出OpenAI試圖通過價格優(yōu)勢重新奪回在企業(yè)市場的份額。
02 個性化升級,AI 真能更懂你嗎?
值得關(guān)注的是,GPT-5在個性化用戶體驗方面邁出了一大步。
舉例來說,如果用戶強調(diào)希望回答簡明扼要、不含廢話,GPT-5可以在整個對話過程中保持簡潔直奔主題的風格,而不需要用戶每次重復要求。
為此,GPT-5也首次推出了預設(shè)人格角色功能,為所有用戶提供了四種預設(shè)的AI助手,分別名為“憤世嫉俗者”(Cynic)、“機器人”(Robot)、“傾聽者”(Listener)和“書呆子”(Nerd)。
每種人格模式都有不同的交流風格,比如,在“傾聽者”模式下,ChatGPT的回答將更加耐心體貼、富有同理心;切換到“憤世嫉俗者”模式,回復則可能帶有一絲諷刺和幽默。這一設(shè)計思路,正如奧爾特曼所說,是希望“讓每個人都能擁有屬于自己的專家AI助手”,增強人機交互的親和力和個性化色彩。
一位經(jīng)常用ChatGPT寫作的資深用戶告訴《節(jié)點財經(jīng)》,可以明顯感受到GPT-5內(nèi)容回復語氣的變化,“更像真人,但對比此前深入研究模式下分條縷析的簡明邏輯回復,現(xiàn)在的回復更加油膩。”
《節(jié)點財經(jīng)》認為,一方面,個性化升級令ChatGPT從千篇一律的答題機器,進化為更具人格魅力的“數(shù)字助手”。這有望提高用戶黏性——普通用戶或企業(yè)員工可能更愿意長期使用一個風格契合自己、懂自己所需的AI伙伴。
但另一方面,個性化也意味著模型會根據(jù)用戶傾向進行一定調(diào)整,這引發(fā)了關(guān)于“確認偏誤”的討論,當AI迎合了用戶的觀點,也可能會加深信息繭房,其實應保持預設(shè)人格的多樣性和適度中立,引導用戶在不同視角間切換,從而避免AI一味迎合導致的偏狹。
除了人格系統(tǒng),個性化也體現(xiàn)在與用戶日常工作流的深度集成。通過與Gmail、Google Calendar等工具的連接,GPT-5能夠訪問用戶的郵件歷史和日程安排,提供高度個性化的響應和建議。
據(jù)《華盛頓郵報》報道,一位測試用戶分享了他的體驗:"GPT-5能夠記住我在之前郵件中提到的項目細節(jié),并在回復新郵件時自動引用相關(guān)信息。這種連貫性讓我感覺像是在與一個真正了解我工作的助手交流。"
03 評價走向兩極,從狂熱贊美到理性質(zhì)疑
薩姆·奧爾特曼在發(fā)布會上將GPT-5的體驗提升比作"iPhone從粗糙的像素屏幕升級到Retina顯示屏的那個時刻",并坦言"當我嘗試回到GPT-4后,感到相當痛苦。"
他還特別強調(diào)了GPT-5在"按需軟件"創(chuàng)建方面的突破。簡而言之,就是用戶可以通過簡單的自然語言描述,即時生成定制化軟件應用,他預言:"按需軟件將成為GPT-5時代的決定性特征。"
然而,學術(shù)界和技術(shù)專家對GPT-5的評價呈現(xiàn)明顯分化。MIT技術(shù)評論發(fā)表評論稱:"GPT-5是一個精心打磨的產(chǎn)品,而非技術(shù)突破。"該評論指出,盡管GPT-5在某些指標上有所改進,但"遠未達到奧爾特曼過去一年所宣傳的那種變革性AI未來。"
開發(fā)者社區(qū)的反饋則更為復雜,代碼編輯器Cursor團隊稱GPT-5為"我們使用過的最智能的模型",特別是在理解復雜代碼庫和生成高質(zhì)量代碼方面。然而,內(nèi)容創(chuàng)作平臺的測試結(jié)果卻不盡如人意,他們發(fā)現(xiàn)GPT-5在某些寫作質(zhì)量評判任務(wù)上"持續(xù)失敗",甚至不如GPT-4o的表現(xiàn)。
上述資深用戶向《節(jié)點財經(jīng)》表示:“凌晨四點半才等到更新使用,湊熱鬧的結(jié)果是系統(tǒng)網(wǎng)絡(luò)直接癱瘓,聯(lián)網(wǎng)任務(wù)全部無法完成,舊模型完全不見蹤影,生成內(nèi)容與GPT-4.5相差甚遠。”
盡管GPT-5一定程度上體現(xiàn)了當前AI技術(shù)的頂尖水準,但各界對其缺陷和局限也有著清醒認識。
首先,“幻覺”問題依然存在。OpenAI的內(nèi)部評估顯示,通過優(yōu)化訓練和人類反饋,GPT-5胡編亂造不實信息的傾向比上一代減少了約60%。然而在開放的現(xiàn)實環(huán)境中,模型難免遇到訓練數(shù)據(jù)覆蓋不到的新問題,此時它可能給出錯誤甚至荒誕的答案。這提示使用者在依賴GPT-5時仍需保留核查和判斷的習慣,不能把AI生成內(nèi)容當作絕對權(quán)威。
《節(jié)點財經(jīng)》發(fā)現(xiàn),在信息提示欄下,GPT-5還特地增添了一行小字說明:“ChatGPT 也可能會犯錯。請核查重要信息。”
其次,推理透明度依然是黑箱。GPT-5做出某個判斷的具體依據(jù),往往難以向用戶解釋清楚。這一點在需要追溯信息來源的場景下尤其明顯。這反映出當前大模型在可解釋性上的天然不足,也是行業(yè)公認的挑戰(zhàn)。
有行業(yè)分析師告訴《節(jié)點財經(jīng)》,讓AI變得“可解釋、可追蹤”將是下階段的重要攻關(guān)方向,但在GPT-5身上這一難題尚未解決。
再者,模型偏見和安全問題也依舊令人關(guān)注。OpenAI雖然在GPT-5中引入了更嚴格的安全措施,包括內(nèi)容過濾、對敏感領(lǐng)域問題設(shè)定特殊模式等,但任何預防措施都無法萬無一失。
上述分析師告訴《節(jié)點財經(jīng)》:“GPT-5的訓練數(shù)據(jù)來自互聯(lián)網(wǎng),難免帶有各種偏見和有害信息的影子。”比如在嘗試引導GPT-5討論政治或社會爭議話題時,模型有時會給出含糊其辭的回應,顯然是在安全規(guī)則下有所保留。然而,在其他一些場景下,GPT-5可能仍會輸出不恰當內(nèi)容或偏頗觀點,如果這些輸出被不加甄別地采信和傳播,可能產(chǎn)生負面影響。
04 AI產(chǎn)業(yè)新格局誕生?
GPT-5的發(fā)布不僅是OpenAI自身的重大節(jié)點,對于整個人工智能產(chǎn)業(yè)都產(chǎn)生了廣泛影響。
首先,它在商業(yè)應用層面的推進有目共睹。OpenAI官方披露,目前已有包括摩根士丹利、貝寶銀行(BBVA)、勞氏(Lowe’s)、軟銀、T-Mobile等在內(nèi)的超過500萬企業(yè)用戶使用了其ChatGPT系列商業(yè)產(chǎn)品。這些覆蓋金融、零售、通信、制藥等行業(yè)的領(lǐng)先企業(yè),正將GPT模型融入研發(fā)、客服、決策支持等關(guān)鍵工作流程中。
隨著GPT-5的到來,各行業(yè)的早期采用者有望進一步擴大領(lǐng)先優(yōu)勢,他們能夠利用GPT-5更準確的分析、更強的創(chuàng)意生成和更長的上下文理解,來重塑業(yè)務(wù)模式。例如,投行可以借助GPT-5快速分析海量財報并生成洞見,電商客服可通過GPT-5實時為顧客提供復雜問題的解決方案,制藥公司則能利用GPT-5來設(shè)計和解析實驗報告。
與此同時,GPT-5的發(fā)布也在產(chǎn)業(yè)競合格局上產(chǎn)生連鎖反應。
它一方面鞏固了OpenAI-微軟在“認知AI即服務(wù)”市場的領(lǐng)先地位,另一方面也激勵競爭對手們加速追趕步伐。據(jù)報道,谷歌正在籌備推出新一代大型模型Gemini,以與GPT-5正面競爭;Meta則持續(xù)開源更大規(guī)模的語言模型,希望在社區(qū)力量下實現(xiàn)技術(shù)突破;中國的科大訊飛、百度、阿里等公司也宣布將升級各自的大模型,力求在本土市場與GPT-5抗衡。
《節(jié)點財經(jīng)》分析,GPT-5在成為行業(yè)新標桿的同時,也迫使所有玩家重新審視各自的AI戰(zhàn)略布局,這種“軍備競賽”固然推動了技術(shù)快速進步,但也引發(fā)監(jiān)管層的關(guān)注。
歐美多國監(jiān)管機構(gòu)已明確表示,將密切關(guān)注像GPT-5這樣具顛覆性的AI產(chǎn)品,確保其發(fā)展“不偏離安全和倫理軌道”。歐盟正在制定的《AI法案》就要求,高風險AI系統(tǒng)需提高透明度并通過合規(guī)評估?梢灶A見,未來圍繞強大AI的治理框架將更加完善,以促進技術(shù)在規(guī)范中健康發(fā)展。
寫在最后
GPT-5的面世,或許標志著生成式人工智能進入了新的階段。
從技術(shù)層面看,它讓機器離“懂人”更近了一步;從應用層面看,它正深刻影響著各行各業(yè)的效率和模式。當然,我們也必須正視GPT-5仍存的不足與風險,在驚嘆于AI先進性的同時,繼續(xù)保持理性與審慎。
這或許正是薩姆·奧爾特曼等AI領(lǐng)軍者反復強調(diào)的初衷:讓AI成為增進人類能力的工具,而非失控的風險來源。
在機遇與挑戰(zhàn)并存的AI新紀元,GPT-5為我們展開了一幅充滿想象力的圖景,真正的考驗則在于我們?nèi)绾务{馭好這匹“智能駿馬”,讓其沿著正確的方向前進。相信在全球產(chǎn)學研各界的共同努力下,人工智能的未來將朝著我們期望的方向發(fā)展,GPT-5帶來的只是一個開始。
原文標題 : ChatGPT-5 來了:從狂熱贊美到理性質(zhì)疑

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
11月27日立即報名>> 【工程師系列】汽車電子技術(shù)在線大會
-
精彩回顧立即查看>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應用案例與方案解析
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
- 1 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 2 黃仁勛:與雷軍長期合作,共探AI智駕
- 3 阿里首位程序員,“掃地僧”多隆已離職
- 4 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進化
- 5 六大國產(chǎn)大模型,誰是最強“金融分析師”?|錦緞評測
- 6 2025年第一支10倍股,來了!
- 7 募資39.85億元!寒武紀押注大模型芯片與軟件平臺
- 8 國內(nèi)免費版Deep Research上線,秘塔AI深度研究嘗試重塑知識工作范式
- 9 清庫存?曝英偉達H20供應有限,且沒有復產(chǎn)計劃
- 10 賈躍亭再獲 7.5 億元融資,用于新車FF 91 生產(chǎn)交付