訂閱
糾錯
加入自媒體

Agent應(yīng)用爆發(fā),誰成為向上托舉的力量?

經(jīng)過兩年多的發(fā)展后,AI開始加速進(jìn)入Agent時代。

當(dāng)AI從“被動響應(yīng)”邁向“主動決策”,AI Agent正成為連接數(shù)字世界與物理世界的核心樞紐。

從自動處理客戶服務(wù)工單的企業(yè)Agent,到協(xié)調(diào)多步驟科研實驗的學(xué)術(shù)Agent,再到管理智能家居生態(tài)的個人Agent,這種具備推理、規(guī)劃、記憶與工具使用能力的智能體,正在重塑產(chǎn)業(yè)形態(tài)。

但支撐其智能的,是一套復(fù)雜且精密的基礎(chǔ)設(shè)施——它不僅包含算法與模型,更涵蓋從研發(fā)到部署、從協(xié)作到運維的全生命周期支撐體系。

2025年,AI Agentic基礎(chǔ)設(shè)施(Agent Infra)迎來爆發(fā)拐點。DeepSeek、Qwen等開源大模型的突破為 Agent提供了強(qiáng)大的認(rèn)知“大腦”,而模型上下文協(xié)議(MCP)的生態(tài)繁榮則賦予其靈活“四肢”。

據(jù)IDC預(yù)測,全球80%企業(yè)將在年內(nèi)部署Agent。“大腦”與“四肢”的協(xié)同進(jìn)化,正在倒逼承載二者的“軀干”全面升級,Agent Infra成為技術(shù)攻堅的核心戰(zhàn)場。

Agent企業(yè)應(yīng)用

面臨五大痛點

利用AI的能力將工作流程自動化,這類產(chǎn)品早已有之。在生成式AI出現(xiàn)之前,就有RPA類產(chǎn)品大行其道。

但限于當(dāng)時的AI能力還較弱,RPA只能將簡單的單一工作流程自動化,不具備真正的智能,不能解決復(fù)合化的復(fù)雜問題。

直到生成式AI出現(xiàn),各種真正具備智能的Agent應(yīng)用出現(xiàn),人們才從AI自動化中獲得了很好的效率提升。

Agent本質(zhì)是一個能調(diào)用各種工具的AI。比如Manus,它用提示詞控制AI模型,并編排了一個精巧的工作流(Work Flow),讓AI模型使用各種不同的工具,然后完成一個復(fù)雜的任務(wù)。

但是,無論是以DeepResearch為代表的研究類Agent應(yīng)用,還是Manus這樣的通用Agent應(yīng)用,都是通過網(wǎng)頁或App的形式對終端的用戶提供。

這種提供方式,并不適合專業(yè)的AI開發(fā)者,AI創(chuàng)業(yè)者和企業(yè)用戶。因為他們的需求是讓Agent使用專有的數(shù)據(jù),無縫地嵌入到業(yè)務(wù)中,為業(yè)務(wù)持續(xù)提供價值。

商業(yè)化使用Agent,首先遇到的就是終端性能,但當(dāng)一個功能強(qiáng)大的Agent在用戶本地的終端運行時,會遇到各種各樣的問題。

首當(dāng)其沖的是AI推理的算力限制。Agent由一個能力強(qiáng)大的AI模型及一堆供它調(diào)用的工具鏈組成。

運行能力強(qiáng)大的AI模型,通常需要AI專用的算力,由GPU或AI專用芯片提供,幾乎沒有消費級的PC或手機(jī)能部署高精度的大模型本體。因此,目前大量的Agent公司都采用了云端算力的方式,將模型的訓(xùn)練和推理都放在云端完成。

其次是執(zhí)行任務(wù)的算力。Agent任務(wù)具有高并發(fā)、高算力需求的特點,企業(yè)在本地部署了Agent后,當(dāng)Agent支持的業(yè)務(wù)量開始快速增長時,馬上就需要更多算力,本地部署的速度跟不上;反過來,當(dāng)這個業(yè)務(wù)閑置時,又沒有那么多算力需求,會對企業(yè)造成巨大資源浪費。

比如Manus在初期是用本地服務(wù)器的虛擬機(jī)去做任務(wù),這也導(dǎo)致它在用戶大量涌入的時候,出現(xiàn)了性能不足、服務(wù)不穩(wěn)定的情況,一定程度上影響了初期口碑。

再次是AI工具配置麻煩。Agent若不能調(diào)用工具,就很難具備解決復(fù)雜問題的能力。

例如,要搭建一個銷售類Agent,它需要調(diào)用CRM獲取客戶信息,調(diào)用內(nèi)部的知識庫以備自動向客戶介紹產(chǎn)品,還需要調(diào)用各種通訊工具以便直接觸及到客戶。

國內(nèi)各地已經(jīng)有不少的智算中心,可以初步緩解算力限制問題,但是這些智算中心卻只提供算力,不提供搭建Agent需要的各種工具鏈。

企業(yè)要定制與業(yè)務(wù)緊密耦合的Agent,就需要自己搭建工具鏈。這是一個很復(fù)雜的工程,一方面需要很高的開發(fā)成本,另一方面,在Agent正式部署前,需要不短的開發(fā)時間,這反而會延緩企業(yè)的業(yè)務(wù)發(fā)展速度。

當(dāng)解決了算力限制和AI工具配置的問題后,專業(yè)AI開發(fā)者和企業(yè)用戶馬上會遇到第三個問題是權(quán)限沖突。

開發(fā)和部署Agent的目的,是將其嵌入到自己的業(yè)務(wù)中。而這個過程,除了要調(diào)用各種各樣的工具以外,還需要與業(yè)務(wù)中的各類軟件緊密配合。

以銷售類Agent為例,當(dāng)它調(diào)用CRM,內(nèi)部知識庫和對外通訊工具時,不僅會占用本地計算資源,更麻煩的是,它會搶占人類員工的訪問和操作權(quán)限。

當(dāng)Agent不是與人類協(xié)同,而是互相內(nèi)耗時,反而可能拉低整個團(tuán)隊的整體工作效率。

對于企業(yè)用戶,還有一個大問題,就是安全性差。企業(yè)使用Agent的目的就是要增強(qiáng)自己的業(yè)務(wù),或者提高員工的效率,這勢必需要使用公司的內(nèi)部數(shù)據(jù)。

但是Agent任務(wù)執(zhí)行是一個黑盒子,執(zhí)行過程對于用戶來說是不透明的,有可能對本地電腦文件系統(tǒng)進(jìn)行修改、刪減等操作,輕則留下垃圾文件造成系統(tǒng)臃腫,重則造成文件丟失或數(shù)據(jù)泄露。

更進(jìn)一步,其實Agent在調(diào)用工具時,本身就會有安全隱患。

據(jù)統(tǒng)計,超過43%的MCP服務(wù)節(jié)點存在未經(jīng)驗證的Shell調(diào)用路徑,超過83%的部署存在MCP配置漏洞;88%的AI組件部署根本沒啟用任何形式的防護(hù)機(jī)制。

當(dāng)未來Agent的使用越來越普及,安全和信任的重要性,在AI時代比在互聯(lián)網(wǎng)時代更加重要。

當(dāng)真正把本地部署Agent用起來后,企業(yè)還會面臨一個問題,就是Agent缺乏長期記憶。

當(dāng)缺乏語義記憶和場景記憶,Agent能完成一次性的任務(wù),這會嚴(yán)重影響Agent在企業(yè)業(yè)務(wù)中的使用范圍。

當(dāng)企業(yè)用戶將Agent用到業(yè)務(wù)中時,如果能為其賦予長期記憶,那么Agent除了能夠完成多次任務(wù),企業(yè)還可以根據(jù)這些記憶迭代Agent,使其對業(yè)務(wù)或用戶的理解越來越深,在特定任務(wù)上的能力越來越強(qiáng)。

Agent Infra乘風(fēng)而來

如今,云廠商競相推出新一代Agent Infra技術(shù)架構(gòu)。

比如AWS 推出AgentCore(預(yù)覽版),其基于Lambda FaaS基礎(chǔ)設(shè)施深度定制和優(yōu)化的全托管運行時,為Bedrock Agents解決了標(biāo)準(zhǔn)Lambda的關(guān)鍵限制,如長時執(zhí)行、狀態(tài)記錄、會話隔離等。

Azure則推出AI Foundry Agent Service,集成Functions FaaS事件驅(qū)動使得Agent Service能夠利用Serverless計算的事件驅(qū)動、可擴(kuò)展性和靈活性,更輕松地構(gòu)建和部署Agent。

Google Cloud推出Vertex AI Agent Builder,官方雖未明確但普遍推斷其高度依賴并優(yōu)化了Cloud Run(Cloud Functions 2nd Gen已經(jīng)基于Cloud Run來構(gòu)建)來支撐長時運行、并發(fā)和有狀態(tài)的需求。

阿里云推出函數(shù)計算Function AI,官方明確基于FC FaaS的Serverless x AI運行時深度優(yōu)化,推出模型服務(wù)、工具服務(wù)、Agent 服務(wù),開發(fā)者可自主選擇模型、運行時、工具的一個或多個以組裝式設(shè)計構(gòu)建和部署Agent。

PPIO推出國內(nèi)首個Agentic AI基礎(chǔ)設(shè)施服務(wù)平臺——AI智能體,該AI智能體平臺產(chǎn)品分為通用版和企業(yè)版。

通用版以分布式GPU云底座為支撐,發(fā)布中國首款兼容E2B接口的Agent沙箱,以及更適用于Agent構(gòu)建的模型服務(wù)。

Agent沙箱專為Agent執(zhí)行任務(wù)設(shè)計的云端安全運行環(huán)境,支持動態(tài)調(diào)用Browser use、Computer use、MCP、RAG、Search等各種工具,為Agent賦予安全可靠、高效敏捷的“手和腳”。目前,該沙箱已接入Camel AI、OpenManus、Dify等著名開源項目。

這些技術(shù)共同指向同一目標(biāo)——為Agent提供更高彈性、更低延遲、更強(qiáng)安全、更長會話的“軀干”,支撐其從實驗室邁向千萬級企業(yè)場景。

當(dāng)認(rèn)知與行動完成閉環(huán),Agent Infra的技術(shù)代差將決定企業(yè)AI創(chuàng)新和轉(zhuǎn)型的落地速度與質(zhì)量。

Agent開發(fā)范式的演進(jìn)對底層基礎(chǔ)設(shè)施提出了全新要求。

各大云廠商的新一代 Agent Infra聚焦長時運行、會話親和、會話隔離、企業(yè)級IAM和VPC及模型/框架開放等技術(shù)突破,本質(zhì)上是為滿足三類核心Agent形態(tài)的共性需求。

首先是LLM Agent連續(xù)調(diào)用工具的強(qiáng)訴求。LLM Agent需連續(xù)調(diào)用工具鏈完成復(fù)雜推理,可能跨越數(shù)分鐘甚至數(shù)小時。

傳統(tǒng)Serverless的執(zhí)行時長限制(如 AWS Lambda 的15分鐘上限)會強(qiáng)制中斷任務(wù),因此新一代Agent Infra必須突破該限制,支持長時運行。

同時,為維持多輪對話的上下文一致性,需會話親和確保同一請求路由到同一計算實例,避免狀態(tài)丟失。

其次,Workflow Agent對狀態(tài)管理的依賴。自動化工作流(如數(shù)據(jù)處理 Pipeline)需持久化記錄執(zhí)行狀態(tài)。

傳統(tǒng)Serverless的無狀態(tài)特性無法保存中間結(jié)果,而新一代Agent Infra通過提供有狀態(tài)會話保障工作流的原子性和可恢復(fù)性。會話隔離則確保多租戶或高并發(fā)場景下任務(wù)互不干擾,滿足企業(yè)級安全合規(guī)要求。

第三,Custom Agent的靈活性與生態(tài)整合。Custom Agent需集成異構(gòu)工具(API、領(lǐng)域模型、數(shù)據(jù)庫、Code Interpreter、Browser Use等),要求新一代Agent Infra支持模型/框架開放(如 AutoGen、LangChain、AgentScope)。

封閉式架構(gòu)會限制Agent能力擴(kuò)展,而云廠商通過解耦計算層與框架層,可提供插件化集成接口。

新一代Agent Infra在保留Serverless核心優(yōu)勢(全托管免運維、輕量彈性更經(jīng)濟(jì))的同時,通過關(guān)鍵功能(長時運行、會話親和/會話隔離)和技術(shù)突破(狀態(tài)持久化、冷啟動優(yōu)化、開放集成),解決了LLM Agent的持續(xù)推理、Workflow Agent的復(fù)雜狀態(tài)流轉(zhuǎn)、Custom Agent的靈活定制等核心需求。

這標(biāo)志著Agent開發(fā)正從“手動拼湊傳統(tǒng)組件”轉(zhuǎn)向“利用原生Infra實現(xiàn)高效、安全、可擴(kuò)展的開發(fā)部署”這一全新的技術(shù)路徑。

隨著Agent應(yīng)用進(jìn)一步加速,Agent Infra成為模型公司、云廠商、初創(chuàng)公司都在積極拓展的領(lǐng)域。除了云巨頭外,創(chuàng)業(yè)公司在這個領(lǐng)域也有不小的機(jī)會。

首先,是在已有Infra中尋找有AI-native需求的環(huán)節(jié)。這種需求可以是Agent開發(fā)對該環(huán)節(jié)的某些性能提出了更高的要求,例如Sandbox需要更快冷啟動速度、更強(qiáng)的隔離性;這種需求也可以是需要和AI workflow結(jié)合的更好,有更多AI-native的功能點,例如增加RAG功能,或者和某些AI開發(fā)者常用的語言或SDK有更好的結(jié)合。

其次,抓住Agent開發(fā)中的新痛點。Agent開發(fā)要追求R&D和時間投入的ROI,對降低開發(fā)門檻和工程量的Infra產(chǎn)品有較大需求,因此一套易用性高且價格合理的Infra就有機(jī)會被廣泛采用。而且Agent生態(tài)是一個強(qiáng)調(diào)共建的生態(tài)系統(tǒng),而Infra的持續(xù)創(chuàng)新,正在大力推動這種生態(tài)的構(gòu)建。

當(dāng)開發(fā)一個Agent變得像組裝樂高積木一樣便捷,當(dāng)Agent協(xié)作網(wǎng)絡(luò)滲透到社會的每個角落,我們將不再爭論“這是風(fēng)口還是泡沫”,因為這是一個正在到來的新未來。

       原文標(biāo)題 : Agent應(yīng)用爆發(fā),誰成為向上托舉的力量?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號