訂閱
糾錯(cuò)
加入自媒體

狂奔三年,AI智能體祛魅

從概念狂歡到務(wù)實(shí)進(jìn)化。

/

文|楊肖若  編|張弘一

出品|商業(yè)秀

如果說(shuō),去年關(guān)于智能體的故事,還帶著“顛覆想象” 的性感濾鏡。今年這個(gè)故事的注腳,就變成了 “解決實(shí)際問(wèn)題” 的務(wù)實(shí)底色。

從2023年至今,智能體的發(fā)展正從概念走向?qū)嵺`。在今年的世界人工智能大會(huì)上,我們看到各大廠(chǎng)商繼續(xù)推出自己新一代的智能體產(chǎn)品。它們?cè)诟怪奔?xì)分的領(lǐng)域比如金融、教育、文娛等領(lǐng)域落地。

有不少人把2025年稱(chēng)為“智能體元年”。實(shí)際上,智能體的概念最早可以追溯到2023年以前。

螞蟻數(shù)科CTO王維在接受「商業(yè)秀」等媒體的采訪(fǎng)時(shí)指出,2024年11月就被大家稱(chēng)作“智能體元年”,來(lái)到今年7月,元年的高峰已近尾聲。

王維的言外之意是,技術(shù)的迭代速度,如此之快,尤其是基于大模型的智能體。以ChatGPT為例,其獲得10億用戶(hù)、達(dá)成365億次查詢(xún)量的速度,比Google快了14倍。

在更具體的行業(yè)賽道,譬如智能體在金融行業(yè)的變革,也在加速。不過(guò),智能體要迎來(lái)真正的爆發(fā),仍面臨很多挑戰(zhàn)。至少,它還需要跨越“技術(shù)可靠、數(shù)據(jù)可控和生態(tài)協(xié)同” 的三重門(mén)檻。

01智能體狂奔三年:從概念到產(chǎn)業(yè)滲透

從2023年到2025年,智能體的進(jìn)化軌跡,幾乎是劃出了一個(gè)陡峭曲線(xiàn)。在2023年之前,智能體的發(fā)展還停留在概念萌芽階段。這個(gè)時(shí)期,智能體經(jīng)歷了從 “工具化” 到初步智能。

中國(guó)信息通信研究院副總工程師王愛(ài)華認(rèn)為,2023年之前的智能體還停留在 "代理型工具" 階段,就那些連客服機(jī)器人,也只能機(jī)械地給出一些標(biāo)準(zhǔn)化回應(yīng),彼時(shí)的智能體連最簡(jiǎn)單的跨場(chǎng)景對(duì)話(huà)都難以完成,更談不上自主決策。

2024年,成為智能體發(fā)展的關(guān)鍵轉(zhuǎn)折點(diǎn)。大模型技術(shù)的滲透,讓智能體突然具備了"推理-記憶-行動(dòng)" 的基礎(chǔ)能力。比如2024年推出的一些初代金融智能體,已經(jīng)能在金融場(chǎng)景中完成"客戶(hù)咨詢(xún)-需求匹配-業(yè)務(wù)辦理" 的半自動(dòng)化流程。

不過(guò),核心風(fēng)控環(huán)節(jié)上仍然需要人工來(lái) "把關(guān)",其可靠性和場(chǎng)景適配性還需要進(jìn)一步提升。

進(jìn)入2025年,智能體則呈現(xiàn)出了完全不同的氣質(zhì),它們開(kāi)始進(jìn)入產(chǎn)業(yè)滲透階段,垂直深耕和實(shí)現(xiàn)規(guī);涞。這個(gè)階段的智能體主要呈現(xiàn)了三大核心特征。一是從“通用化” 轉(zhuǎn)向 “行業(yè)專(zhuān)用化”。比如金融、能源、工業(yè)等領(lǐng)域出現(xiàn)了很多深度定制的智能體。比如螞蟻數(shù)科推出了Agentar全棧企業(yè)級(jí)智能體平臺(tái)。該平臺(tái)通過(guò)知識(shí)工程、評(píng)測(cè)、安全風(fēng)控、MCP、金融大模型等能力,聯(lián)合行業(yè)開(kāi)發(fā)了100余種金融智能體應(yīng)用方案,在智能風(fēng)控、營(yíng)銷(xiāo)、財(cái)富管理等核心場(chǎng)景落地。

業(yè)內(nèi)認(rèn)為,行業(yè)場(chǎng)景對(duì)智能體的“專(zhuān)業(yè)性”“可靠性” 要求遠(yuǎn)高于通用能力,比如金融領(lǐng)域需嚴(yán)格規(guī)避 “模型幻覺(jué)”,工業(yè)領(lǐng)域需適配高溫、高壓等極端環(huán)境。

二是多智能體協(xié)同成為主流模式。通過(guò)多智能體協(xié)同,解決單智能體的“能力邊界” 問(wèn)題,適配復(fù)雜產(chǎn)業(yè)場(chǎng)景的多元需求,比如金融領(lǐng)域的 “營(yíng)銷(xiāo)智能體+風(fēng)控智能體+合規(guī)智能體” 協(xié)同,這樣一來(lái),就可以覆蓋到業(yè)務(wù)全鏈條。三是從“輔助工具”升級(jí)為“生產(chǎn)力引擎”。據(jù)悉,一些銀已部署超1000個(gè)智能體,其中信用風(fēng)險(xiǎn)識(shí)別智能體,能將中小客戶(hù)授信效率提升10倍,數(shù)據(jù)動(dòng)態(tài)智能體實(shí)現(xiàn) “一句話(huà)調(diào)用全行數(shù)據(jù)”,推動(dòng)業(yè)務(wù)模式從 “人找服務(wù)” 轉(zhuǎn)向 “服務(wù)找人”。也就是說(shuō),這個(gè)階段的智能體不再局限于“降本增效”,而是通過(guò)數(shù)據(jù)洞察和流程重構(gòu),正在創(chuàng)造更多新的價(jià)值。02 金融與能源:智能體落地的必爭(zhēng)之地

在今年WAIC的產(chǎn)業(yè)圖譜中,金融和能源領(lǐng)域的智能體應(yīng)用最為突出。

背后的核心邏輯是什么?

王維認(rèn)為,因?yàn)檫@兩個(gè)行業(yè)數(shù)字化程度最高、數(shù)據(jù)密度最大,且對(duì)效率提升的需求最迫切。

以金融為例,日均千萬(wàn)級(jí)的交易數(shù)據(jù)和多層級(jí)風(fēng)控規(guī)則,傳統(tǒng)人工處理的誤差率超3%,而智能體可將這一數(shù)字壓縮到0.5%以?xún)?nèi)。

但落地過(guò)程并非坦途。比如80%的金融機(jī)構(gòu)僅在客服等非核心場(chǎng)景測(cè)試智能體,清算、風(fēng)控等核心環(huán)節(jié)依然依賴(lài)人工。

這種謹(jǐn)慎源于雙重焦慮——它們既擔(dān)心錯(cuò)失AI紅利,又害怕技術(shù)不成熟引發(fā)安全風(fēng)險(xiǎn)。

也就是說(shuō),很多機(jī)構(gòu)之所以焦慮,并非源于排斥AI,而是發(fā)愁如何將這項(xiàng)新技術(shù)安全、有效地應(yīng)用到自己的業(yè)務(wù)場(chǎng)景中,真正解決問(wèn)題。與此同時(shí),他們看到同行用AI對(duì)業(yè)務(wù)有效果,內(nèi)心也期待能通過(guò)智能體來(lái)實(shí)現(xiàn)“彎道超車(chē)”。

但無(wú)論金融機(jī)構(gòu)和銀行等金融客戶(hù)做哪種選擇,都繞不開(kāi)金融場(chǎng)景的復(fù)雜性。

對(duì)此,螞蟻數(shù)科是如何應(yīng)對(duì)的呢?它的策略是3個(gè)“E”。

一是Expertise(專(zhuān)業(yè))。不沿用通用大模型路徑,基于長(zhǎng)期金融經(jīng)驗(yàn)制定覆蓋銀行、證券等全場(chǎng)景的6大類(lèi)66小類(lèi)金融任務(wù)體系,以此為框架從千億級(jí)數(shù)據(jù)中構(gòu)建專(zhuān)業(yè)訓(xùn)練數(shù)據(jù)集,加入原則類(lèi)合成數(shù)據(jù)保障合規(guī),使模型 “出廠(chǎng)即專(zhuān)家”。

二是Efficiency(效率)。訓(xùn)練中動(dòng)態(tài)分配資源,提升復(fù)雜金融任務(wù)性能與學(xué)習(xí)效率,實(shí)現(xiàn) “淺調(diào)高能”,保障通用能力不退化,減少后續(xù)業(yè)務(wù)應(yīng)用的二次微調(diào)數(shù)據(jù)與算力消耗,降低企業(yè)落地門(mén)檻。

三是Evolution(進(jìn)化)。建立高頻敏捷迭代機(jī)制,持續(xù)吸收金融政策、市場(chǎng)動(dòng)態(tài)等信息,快速修復(fù)模型問(wèn)題,確保知識(shí)、能力與合規(guī)性緊跟行業(yè)變化,在真實(shí)業(yè)務(wù)中不斷進(jìn)化。

能源領(lǐng)域的突破,也同樣依賴(lài)場(chǎng)景適配。據(jù)中控技術(shù)工業(yè)AI技術(shù)管理總經(jīng)理王寬心介紹,其工業(yè)智能體通過(guò)"時(shí)序大模型+邊緣控制" 組合,已實(shí)現(xiàn)煉化裝置的無(wú)人值守:九個(gè)智能體分工協(xié)作,能支撐裝置自主運(yùn)行一周以上,這在高溫高壓的工業(yè)環(huán)境中是一大突破。

據(jù)悉,目前螞蟻數(shù)科已聯(lián)合金融行業(yè)伙伴推出超百個(gè)金融智能體解決方案,覆蓋銀行、證券、保險(xiǎn)、通用金融等四大領(lǐng)域,金融機(jī)構(gòu)可以“即插即用”,提升一線(xiàn)員工工作效率超80%。

03 三重門(mén)檻:技術(shù)、數(shù)據(jù)與生態(tài)的硬仗

盡管發(fā)展勢(shì)頭迅猛,但如今智能體的規(guī)模化落地,仍需跨越三道硬門(mén)檻。

算力仍是懸在行業(yè)頭上的一把“利劍”。清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授鄭緯民直指“痛點(diǎn)”——大模型推理依賴(lài)GPU集群,目前大模型的推理算力成本還是很高。

他解釋到,“不管是推理也好,訓(xùn)練也好,算力成本還是很貴。推理成本里頭,人力占3%,數(shù)據(jù)占2%,算力占95%,錢(qián)主要是花在算力上面了。ChatGPT的推理開(kāi)銷(xiāo)是每天70萬(wàn)美元。DeepSeek V3推理開(kāi)銷(xiāo)大概每天8.7萬(wàn)美元。

業(yè)內(nèi)認(rèn)為,大模型本身成本較高,雖然相關(guān)硬件和技術(shù)在發(fā)展,但相比過(guò)去的軟件售賣(mài),成本仍然是金融機(jī)構(gòu)需要考量的重要因素。

一張卡的推理效率可能很慢,但調(diào)用多次對(duì)底層算力要求極高,如何平衡技術(shù)投入成本與商業(yè)價(jià)值,成為金融機(jī)構(gòu)和技術(shù)提供方需要解決的問(wèn)題。

模型的"幻覺(jué)" 問(wèn)題更讓金融機(jī)構(gòu)頭疼。尤其是在一些信貸審批等場(chǎng)景,智能體偶爾會(huì)給出錯(cuò)誤信息,而客戶(hù)一般要求"每個(gè)決策,你都要說(shuō)清理由",這種可解釋性需求,單靠Prompt技術(shù)難以滿(mǎn)足。

螞蟻數(shù)科AI算法技術(shù)部總經(jīng)理章鵬解釋道,客戶(hù)需要知道大模型回答的思考過(guò)程,要求可解釋性,這就需要推理模型來(lái)解決,而在此之前,只能通過(guò)Prompt強(qiáng)制模型思考,但效果并不理想。

這也是螞蟻數(shù)科聯(lián)合中國(guó)工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會(huì)等機(jī)構(gòu),聯(lián)合推出Finova大模型金融應(yīng)用評(píng)測(cè)基準(zhǔn)的原因。

也就是,用更嚴(yán)苛的測(cè)試倒逼模型的可靠性提升。“客戶(hù)的需求在倒逼技術(shù)進(jìn)化,從最初的‘你們?yōu)槭裁礇](méi)有推理模型’,到現(xiàn)在的‘我憑什么相信你的回答’,市場(chǎng)的要求越來(lái)越具體,也越來(lái)越嚴(yán)苛。”章鵬說(shuō)。

數(shù)據(jù)層面的挑戰(zhàn)同樣棘手。格創(chuàng)東智副總裁李楠吐槽道,"制造業(yè)的數(shù)據(jù)標(biāo)準(zhǔn),亂得像一鍋粥,同個(gè)產(chǎn)品的合格率計(jì)算,A工廠(chǎng)和B 工廠(chǎng)能差出三個(gè)版本。" 這種混亂導(dǎo)致70%的精力都耗在數(shù)據(jù)治理上,嚴(yán)重拖慢了智能體的落地節(jié)奏。

最后是產(chǎn)業(yè)落地層面,也面臨著信任建立與生態(tài)協(xié)同難題。一是行業(yè)觀(guān)望情緒濃厚,金融機(jī)構(gòu)僅在非核心場(chǎng)景(如客服)測(cè)試智能體,核心業(yè)務(wù)(如清算、風(fēng)控)仍依賴(lài)人工。一些機(jī)構(gòu)擔(dān)憂(yōu), “技術(shù)成熟度不足”“責(zé)任界定模糊”,如智能體決策失誤導(dǎo)致?lián)p失時(shí),責(zé)任歸屬難以明確。

生態(tài)協(xié)同的碎片化,則是另一重阻礙。因?yàn)橹悄荏w產(chǎn)業(yè)鏈涉及硬件、模型、應(yīng)用等多環(huán)節(jié),單一企業(yè)難以覆蓋全鏈條能力。例如,銀行部署智能體需協(xié)調(diào)模型提供商、系統(tǒng)集成商、監(jiān)管機(jī)構(gòu)等多方,協(xié)同成本高企。

為了降低成本,螞蟻數(shù)科推出了全尺寸模型家族,也給客戶(hù)提供了不同規(guī)格的模型,比如32B和8B版本的金融推理大模型Agentar-Fin-R1,以及基于百靈大模型的MOE架構(gòu)模型,讓客戶(hù)可以根據(jù)自身算力和場(chǎng)景需求選擇,平衡成本與效果。

結(jié)語(yǔ)

目前智能體仍處于快速發(fā)展階段,但要實(shí)現(xiàn)真正的爆發(fā),還需要在技術(shù)完善、成本控制、滿(mǎn)足差異化需求等方面突破。

中信智庫(kù)發(fā)布的研究報(bào)告指出,2025年AI大模型向更強(qiáng)、更高效、更可靠方向發(fā)展,呈現(xiàn)推理模型深化、智能體模型爆發(fā)的格局。

今年也是AI應(yīng)用加速落地之年,但今年以來(lái)的智能體故事,少了些“性感”,多了些“硬仗”。這或許正是技術(shù)改變世界的必經(jīng)之路。

正如上海新金融研究院理事長(zhǎng)、上海市原常務(wù)副市長(zhǎng)屠光紹在2025年世界人工智能大會(huì)的論壇上所言——“智能體的真正價(jià)值,不在于概念多吸引人,而在于能否成為推動(dòng)產(chǎn)業(yè)變革的‘可行生產(chǎn)力’。”

當(dāng)行業(yè)不再熱衷于討論“智能體能做什么”,而是聚焦“智能體該如何解決場(chǎng)景問(wèn)題”時(shí),智能體的產(chǎn)業(yè)價(jià)值,才真正開(kāi)始釋放!竿辍

       原文標(biāo)題 : 狂奔三年,AI智能體祛魅

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀(guān)點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)