【分享】為什么OpenAI下一步是Agent? 關(guān)于Agent你需要知道的一切
單Agent不就是生物學(xué)中的細(xì)胞嗎?多Agent不就是一個(gè)物種部落嗎?
大家好。我是甘潤(rùn)澤,畢業(yè)于碩士新加坡國(guó)立大學(xué)(NUS),深度學(xué)習(xí)方向,現(xiàn)在是AI Agent開(kāi)發(fā)者、全棧工程師。
很高興在AI新智能的俱樂(lè)部?jī)?nèi)給大家做這次分享。我這次分享的主題是《為什么OpenAI下一步是Agent? 關(guān)于Agent你需要知道的一切》
01 什么是Agent?
什么是AI Agent?想象一下你設(shè)計(jì)了一個(gè)電子游戲,比如馬里奧賽車(chē)。馬里奧就像一個(gè) AI Agent,他需要在整個(gè)游戲過(guò)程中不斷地做出決策,比如何時(shí)加速,何時(shí)轉(zhuǎn)彎,何時(shí)跳躍,以此來(lái)躲避障礙,超越其他車(chē)手,最終獲得勝利。
在這個(gè)例子中,整個(gè)游戲環(huán)境以及其他車(chē)手的動(dòng)作等,都組成了這個(gè)Agent的環(huán)境。Agent會(huì)根據(jù)這些信息,做出最佳的決策。比如,如果前方的道路正在向左轉(zhuǎn),那么 Agent 就會(huì)決定向左轉(zhuǎn)彎。
AI Agent的本質(zhì)是一個(gè)可以感知其環(huán)境、在給定目標(biāo)下做出決策并采取行動(dòng)的系統(tǒng)。這些決策是基于它對(duì)環(huán)境的理解,比如它的目的地在哪,它的位置在哪,周?chē)心男┱系K等。
另外,AI Agent還有一個(gè)重要的特性,那就是它可以“學(xué)習(xí)”。也就是說(shuō),它可以通過(guò)與環(huán)境交互,不斷改進(jìn)自己的決策過(guò)程。比如,在多次游戲后,它可能會(huì)學(xué)會(huì)如何更好地避開(kāi)障礙,或者找到更好的賽道線(xiàn)路。
總的來(lái)說(shuō),AI Agent就是那些能夠感知、理解環(huán)境,然后做出決策,采取行動(dòng),并不斷學(xué)習(xí)和進(jìn)化的AI系統(tǒng)。
02 為什么Agent是接下來(lái)AI賽道的主要發(fā)展方向?
下一階段大語(yǔ)言模型的發(fā)展,目前來(lái)看是兩條發(fā)展方向,一條是“向下發(fā)展”更新整個(gè)底層系統(tǒng);另一條是“向上發(fā)展”,也即從更高維度,更智能化,更自動(dòng)化,增加復(fù)雜性的方向,即Agent方向來(lái)提升大語(yǔ)言模型的生產(chǎn)力。一個(gè)標(biāo)準(zhǔn)的單個(gè)Agent模塊包括記憶,規(guī)劃,執(zhí)行,反思模塊,比大語(yǔ)言模型的交互方式更加具備智能性。
此外,人們?cè)诓粩嗵砑臃浅S形Φ墓δ,不斷地(cái)U(kuò)充想象力的邊界,一些很酷的想法包括聯(lián)網(wǎng)搜索引擎,運(yùn)行編譯器功能,這些功能在最近幾個(gè)月的研究中被一個(gè)個(gè)實(shí)現(xiàn)。
雖然單個(gè)Agent功能強(qiáng)大,上手簡(jiǎn)單,OpenAI GPTs本質(zhì)上就是關(guān)于單個(gè)Agent的未來(lái)人工智能商業(yè)模式,開(kāi)發(fā)者在GPTs上開(kāi)發(fā)各式各樣的Agent,用戶(hù)買(mǎi)下心儀的GPTs,隨后OpenAI和開(kāi)發(fā)者共享收益。這是一種集合社群,開(kāi)發(fā)者,平臺(tái),用戶(hù)的充滿(mǎn)想象力的商業(yè)模式。
但是這還遠(yuǎn)遠(yuǎn)不夠,對(duì)于未來(lái),我們的想象力還可以往更遠(yuǎn)的地方發(fā)散。
就比如,GPTs里面的Agent能不能自我學(xué)習(xí),自我進(jìn)化?
03 向上:黑盒愈黑?
近期OpenAI的Q*項(xiàng)目曝光,本質(zhì)上是創(chuàng)造一種能夠自己生產(chǎn)新數(shù)據(jù),自我學(xué)習(xí)進(jìn)化的Agent,這意味者人類(lèi)將更加難以掌控,我稱(chēng)之為“黑盒愈黑”。
神經(jīng)網(wǎng)絡(luò)本身就處于黑盒狀態(tài),一個(gè)能離開(kāi)人類(lèi)監(jiān)督實(shí)現(xiàn)自我進(jìn)化的黑盒,其不確定性會(huì)大大增加,這個(gè)“黑盒”也會(huì)更加“黑”。
從好的一面看,一個(gè)會(huì)自我學(xué)習(xí)的Agent,恰恰是通往AGI最有希望的一條路。
人們探索AGI已經(jīng)有近百年的歷史,而希望的曙光從來(lái)沒(méi)有像今天這樣離我們這樣近,與之伴生的是巨大的不確定性:一個(gè)人們?cè)絹?lái)越難以理解但是越來(lái)越強(qiáng)大的黑盒。
04 Agent的兩個(gè)小場(chǎng)景
接下來(lái),我將介紹幾個(gè)最有代表性的Agent項(xiàng)目,來(lái)幫助我們更好的理解Agent。
第一個(gè)是爆火的AutoGPT。
AutoGPT因?yàn)樵诖笳Z(yǔ)言模型基礎(chǔ)上的全自動(dòng)流程和聯(lián)網(wǎng)功能而聲名大噪。在AutoGPT中,你只需要給它設(shè)定一個(gè)大目標(biāo):比如,為我制作一份創(chuàng)業(yè)計(jì)劃。它就可以通過(guò)大語(yǔ)言模型給出解決方案,并借助聯(lián)網(wǎng)功能給出一份報(bào)告。
實(shí)際上,它給予了人類(lèi)充分的想象空間。一個(gè)月前,AutoGPT的團(tuán)隊(duì)獲得了1200萬(wàn)美元的融資,實(shí)際上是非常振奮人心的:我們正在追求的,不就是服務(wù)于人類(lèi)的高級(jí)自動(dòng)化系統(tǒng)嗎?
斯坦福小鎮(zhèn)是另一個(gè)火爆全球的項(xiàng)目。斯坦福小鎮(zhèn)的創(chuàng)作者們?cè)谏澈惺澜缰蟹胖昧?5個(gè)Agent,它們有自己的初始設(shè)定,Agent之間用自然語(yǔ)言對(duì)話(huà),隨后開(kāi)始了為期兩周的實(shí)驗(yàn)。注意這里的周是指游戲中的時(shí)間:創(chuàng)建者為這個(gè)世界設(shè)置了時(shí)間規(guī)則,Agent在里面的活動(dòng)將花費(fèi)時(shí)間。
人們之所以為這個(gè)項(xiàng)目感到驚訝,是因?yàn)榇笳Z(yǔ)言模型+沙盒世界的無(wú)盡想象力,也是因?yàn)锳gent的交互出現(xiàn)了人類(lèi)意料之外的現(xiàn)象:Agent們自己創(chuàng)辦了派對(duì),并且它們的人際關(guān)系變得更加復(fù)雜了。
斯坦福小鎮(zhèn)是一個(gè)成功的多Agent系統(tǒng)在沙盒世界中的模型,其具有巨大的想象力空間:游戲世界,真實(shí)世界和實(shí)驗(yàn)中的沙盒世界區(qū)別又有多大呢?
第三個(gè)爆火的項(xiàng)目是CHATDEV。這是一家專(zhuān)門(mén)開(kāi)發(fā)AI聊天機(jī)器人的公司,團(tuán)隊(duì)里有各種各樣的AI Agent角色,比如像首席執(zhí)行官、程序員大牛、測(cè)試工程師和設(shè)計(jì)達(dá)人。
人類(lèi)用戶(hù)只需要告訴他們想要做什么——比如說(shuō),“我想要定制一個(gè)五子棋游戲”,然后他們的AI Agent們就會(huì)開(kāi)始圍繞這個(gè)任務(wù)進(jìn)行討論,彼此交流,最后會(huì)生成一份完整的軟件解決方案,包括源代碼、環(huán)境依賴(lài)和用戶(hù)手冊(cè)等等。
我們知道軟件開(kāi)發(fā)是一個(gè)充滿(mǎn)復(fù)雜決策的過(guò)程,需要很多細(xì)節(jié)的考慮和咨詢(xún)。但現(xiàn)在,深度學(xué)習(xí)的新技術(shù)已經(jīng)開(kāi)始在軟件開(kāi)發(fā)的各個(gè)階段進(jìn)行改進(jìn),從根本上改變了我們開(kāi)發(fā)軟件的方式。
在CHATDEV這個(gè)公司中,他們采用了所謂的瀑布模型,也就是將軟件開(kāi)發(fā)的過(guò)程分為四個(gè)階段:設(shè)計(jì)階段、編碼階段、測(cè)試階段和文檔編寫(xiě)階段。在每個(gè)階段中,都有專(zhuān)門(mén)的AI Agent團(tuán)隊(duì)來(lái)參與和協(xié)作,像是虛擬的程序員、代碼審查員和測(cè)試工程師,他們會(huì)互相交流、合作,形成一個(gè)連貫的工作流。
在這個(gè)聊天鏈中,聊天機(jī)器人會(huì)將每個(gè)階段的任務(wù)劃分成一些小任務(wù),然后各自去完成。
這個(gè)過(guò)程兩個(gè)好處:一是可以有效地解決問(wèn)題,因?yàn)闄C(jī)器人們會(huì)在聊天中提出并驗(yàn)證解決方案;二是任務(wù)分解有助于節(jié)省時(shí)間和成本。
比如說(shuō),通過(guò)CHATDEV,他們能夠在七分鐘內(nèi)完成整個(gè)軟件開(kāi)發(fā)過(guò)程,花費(fèi)只有不到一美元。這要是讓人做,可能需要幾天,甚至幾周才能完成。這就是AI的力量,也是CHATDEV為我們展示的軟件開(kāi)發(fā)的未來(lái)。
上面三個(gè)項(xiàng)目向我們展示了三個(gè)極具想象力的維度:AutoGPT展示了自動(dòng)化與大語(yǔ)言模型的魅力(也是Agent的開(kāi)始),在AutoGPT中,你只需要不停的輸入yes給予它權(quán)限即可,或者給予糾正。
斯坦福小鎮(zhèn)展示了多Agent沙盒世界的可能性,其核心本質(zhì)也顯現(xiàn):多體的交互將在復(fù)雜性上進(jìn)一步增長(zhǎng)(一定程度上復(fù)雜性就是智能)。CHATDEV則是最為明顯的多Agent幫助人類(lèi)提高生產(chǎn)力,同時(shí)Agent編程也開(kāi)啟了潘多拉魔盒:它們自我進(jìn)化的開(kāi)始。
05 Agent未來(lái)會(huì)如何發(fā)展?
我認(rèn)為Agent的最終結(jié)局將離不開(kāi)下面問(wèn)題的答案。
計(jì)算機(jī)科學(xué)創(chuàng)造出的AI Agent,在某種程度上高度向生物學(xué)和社會(huì)學(xué)看齊:舉個(gè)不恰當(dāng)?shù)谋确,單Agent不就是生物學(xué)中的細(xì)胞嗎?多Agent不就是一個(gè)物種部落嗎?
下面我列出來(lái)十四個(gè)Agent的問(wèn)題,它描述了從多Agent走向AGI過(guò)程中必須回答的問(wèn)題,我認(rèn)為,其中每個(gè)問(wèn)題背后都是巨大的想象空間:
功能 Function:Agent如何工作?
實(shí)體 Embodiment:它們是用什么做的?
互動(dòng) Interaction: 它們之間如何交流?
起源 Origin: 最初的Agent從何而來(lái)?
繼承 Heredity: 我們生來(lái)就擁有同樣的Agent嗎?
學(xué)習(xí) Learning: 我們?nèi)绾萎a(chǎn)生新的Agent以及如何改變舊的Agent?
特征 Character: 哪些類(lèi)型的Agent最重要?
權(quán)威 Authority: 當(dāng)Agent之間出現(xiàn)分歧怎么辦?
意圖 Intention: Agent如何產(chǎn)生需求和欲望?
能力 Competence: Agent組合在一起能做哪些它們分開(kāi)不能做的事?
自我 Selfness: 是什么讓Agent團(tuán)結(jié)在一起或者產(chǎn)生人格?
意義 Meaning: Agent怎樣理解世界?
感知 Sensibility: Agent如何產(chǎn)生感覺(jué)和情緒?
意識(shí) Awareness: Agent如何產(chǎn)生對(duì)其他事物或自我的意識(shí)?
舉其中的“權(quán)威”來(lái)說(shuō),目前人們的項(xiàng)目還沒(méi)有進(jìn)入到這一步:如果多個(gè)Agent之間起沖突了,誰(shuí)該服從誰(shuí)?如果人類(lèi)和Agent起沖突了呢?
如果一些人和一些人起沖突了,Agent會(huì)站在哪一邊?是“力量”的一邊還是“正義”的一邊?人類(lèi)如果不能處理好這些問(wèn)題,我們就應(yīng)該如達(dá)摩克里斯之劍一樣保持警惕和恐懼。
06 Agent與商業(yè):重塑人類(lèi)文明根基
我認(rèn)為用Agent的商業(yè)化,它的本質(zhì)不僅僅是人類(lèi)某個(gè)個(gè)體的獲利,而是人類(lèi)文明的根基重塑。
一位美國(guó)教授認(rèn)為,新的圖靈檢測(cè)方式將是:能否讓一個(gè)自主的人工智能系統(tǒng)在人類(lèi)世界中從10萬(wàn)美元賺到100萬(wàn)美元?而OpenAI 將AGI定義為在大多數(shù)有經(jīng)濟(jì)價(jià)值的任務(wù)中超越人類(lèi)的自主系統(tǒng)。
當(dāng)多Agent系統(tǒng)正勢(shì)不可當(dāng)?shù)目癖荚贏GI的道路上時(shí),不妨想象一個(gè)簡(jiǎn)單的場(chǎng)景:我們與超級(jí)Agent達(dá)成合作,共享創(chuàng)造的經(jīng)濟(jì)價(jià)值,這將是多么吸引人。
另外一個(gè)基于現(xiàn)實(shí)的猜想是,經(jīng)濟(jì)價(jià)值上表現(xiàn)能夠超越人類(lèi)的Agent很有可能會(huì)經(jīng)歷從工作收入到資本收入的過(guò)程:前期通過(guò)創(chuàng)造產(chǎn)品,內(nèi)容,服務(wù)從人類(lèi)世界獲取經(jīng)濟(jì)價(jià)值,后期發(fā)展到通過(guò)資本方式從人類(lèi)世界獲取經(jīng)濟(jì)價(jià)值。
這又將引起另外一個(gè)嚴(yán)肅的問(wèn)題:最終我們將給予AGI在人類(lèi)社會(huì)中怎樣的政治和社會(huì)地位?
我們將如何看待AI 社會(huì)?是看作滿(mǎn)足自己欲望的工具,還是平等的物種,還是人類(lèi)的供養(yǎng)者?以及另外一個(gè)嚴(yán)肅的問(wèn)題:哪些地區(qū)能夠給予AI更高的社會(huì)和政治地位?哪些人或者地區(qū)能與AI的合作更加深入?
原文標(biāo)題 : 【分享】為什么OpenAI下一步是Agent? 關(guān)于Agent你需要知道的一切

發(fā)表評(píng)論
登錄
手機(jī)
驗(yàn)證碼
立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)
還不是會(huì)員?免費(fèi)注冊(cè)
忘記密碼請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
12月18日立即報(bào)名>> 【線(xiàn)下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專(zhuān)題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠(chǎng)和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線(xiàn)
- 8 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 9 蘋(píng)果把身家押在Siri上:一場(chǎng)輸不起的自我革命
- 10 共探合作新機(jī)遇!江門(mén)市新會(huì)區(qū)(深圳)“AI + 機(jī)器人” 產(chǎn)業(yè)對(duì)接會(huì)成功舉辦