未來機(jī)器人:一起工作 互相學(xué)習(xí)
通過“強(qiáng)化學(xué)習(xí)”,讓每個智能體適應(yīng)周圍環(huán)境和群體協(xié)作。未來的分布式機(jī)器人可以互相學(xué)習(xí),一起工作,共同完成復(fù)雜任務(wù)。圖片來自網(wǎng)絡(luò)
分布式智能體(Agent)具有自主性、交互性、反應(yīng)性和主動性
據(jù)美國《連線》雜志網(wǎng)站近日報道,目前大部分人工智能研究都集中在個體智能體(Agent,指能自主活動的軟件或者硬件實體)上,人工智能系統(tǒng)也一直是作為個體運作,但這些個體智能體不能組合成一個團(tuán)隊來學(xué)習(xí)、工作,也不能相互協(xié)作完成相應(yīng)的任務(wù)。麻省理工學(xué)院航空航天教授喬納森·豪認(rèn)為,這種工作模式喪失了一個巨大的機(jī)會,未來機(jī)器人應(yīng)該一起工作,互相學(xué)習(xí)。
在分布計算領(lǐng)域,人們通常把在分布式系統(tǒng)中持續(xù)自主發(fā)揮作用并具有自主性、交互性、反應(yīng)性和主動性的計算實體稱為Agent。例如一輛單獨行駛在街道上的汽車,一種能根據(jù)周圍環(huán)境變化而不斷調(diào)整的恒溫器。
豪領(lǐng)導(dǎo)的研究團(tuán)隊一直致力于研究改變“移動和人工智能設(shè)備相互協(xié)作和學(xué)習(xí)的方式”,希望通過人工智能的核心能力——機(jī)器學(xué)習(xí),幫助智能對象,使彼此更智能。
豪認(rèn)為,未來機(jī)器人可以互相學(xué)習(xí),共同工作,從而改變物流(機(jī)器人完成訂單并送貨上門)和太空探索(機(jī)器人合作探索新領(lǐng)域)等行業(yè)。而真正的挑戰(zhàn)是為這些人工智能機(jī)器人在實驗室之外的真實世界做好準(zhǔn)備,這才是人工智能應(yīng)該涉獵的領(lǐng)域。
機(jī)器人個體結(jié)成團(tuán)隊工作
現(xiàn)實世界遠(yuǎn)比人工智能機(jī)器人開發(fā)實驗室環(huán)境復(fù)雜。在團(tuán)隊工作中,人類會思考,其他人在做什么?如何共同完成任務(wù)?這個任務(wù)會發(fā)生怎樣的變化?等等。而這些問題,都將是機(jī)器人以團(tuán)隊形式工作時所需要“考慮”的。
為了讓機(jī)器人以群體形式工作,豪帶領(lǐng)的團(tuán)隊讓智能體在周邊環(huán)境中反復(fù)試驗,像人類一樣學(xué)習(xí)。團(tuán)隊利用他們自己開發(fā)的新算法,以及機(jī)器人行業(yè)的經(jīng)驗,對其進(jìn)行了優(yōu)化,使用了一種名為強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)技術(shù),讓它們適應(yīng)周邊環(huán)境。
團(tuán)隊甚至更進(jìn)一步研究了“多智能體”參與時發(fā)生了什么。“多智能體”強(qiáng)化學(xué)習(xí)這門新興學(xué)科存在許多難題,包括:如何讓獨立的智能體在其他方面建立共識并達(dá)成一致?如何確保它們之間不斷的交談不會淹沒整個網(wǎng)絡(luò)?當(dāng)一個有人工智能功能的機(jī)器人認(rèn)為自己知道正確的做事方式,但它卻錯了時又會發(fā)生什么?
豪說:“如果我們對什么時候去吃晚飯都有不同的看法,你需要多少溝通才能達(dá)成一致?這看起來相對簡單的問題,但在機(jī)器人系統(tǒng)中,我們要處理的問題非常多,通常這些問題都有很多不確定性!
只有出現(xiàn)了可行的深度學(xué)習(xí)平臺,才有可能真正回答這些問題。豪和他的團(tuán)隊使用由亞馬遜的EC2 GPU實例支持的AWS深度學(xué)習(xí)AMI環(huán)境,這些實例不需要管理機(jī)架和服務(wù)器,就可以在云上執(zhí)行非常復(fù)雜的計算。他們的最終目標(biāo)是訓(xùn)練和運行強(qiáng)化學(xué)習(xí)模型的速度和準(zhǔn)確性,以保證機(jī)器人足以應(yīng)對現(xiàn)實世界中行為的影響。比如,當(dāng)機(jī)器人意見不一致時,它們之間不斷的嘮叨不會淹沒整個網(wǎng)絡(luò)。
復(fù)雜計算需要云平臺
在智能機(jī)器人共同學(xué)習(xí)的理想生態(tài)系統(tǒng)中,整體大于部分之和,這需要重大的技術(shù)努力才能實現(xiàn)。
在亞馬遜云服務(wù)(AWS)、波音和IBM聯(lián)合資助下,豪的團(tuán)隊已經(jīng)進(jìn)行了一段時間的深入研究,通過足夠的計算能力運行復(fù)雜的強(qiáng)化學(xué)習(xí)算法,使一群機(jī)器人保持不斷的通信,并在聯(lián)機(jī)中調(diào)整它們的行為。新的強(qiáng)化學(xué)習(xí)系統(tǒng)被稱為分層多智能體教學(xué),通過優(yōu)化獎勵功能和更有效的溝通,成功地提高了機(jī)器人在團(tuán)隊范圍內(nèi)的學(xué)習(xí)和協(xié)作整合解決問題的能力。利用基于云的服務(wù),團(tuán)隊中的每個成員都可以根據(jù)自己的需要,訪問盡可能多的計算能力。
“在這種基于模擬的訓(xùn)練中,我們要測試數(shù)百種設(shè)置,速度是至關(guān)重要的!焙澜淌诘拇T士研究生金東基(音譯)說,“機(jī)器學(xué)習(xí)直接轉(zhuǎn)化為我們在更短的時間內(nèi)運行更多迭代的能力。AWS提供了強(qiáng)大的GPU實例,大大縮短了訓(xùn)練時間,加快了我們的研究步伐!
豪認(rèn)為,這項研究商業(yè)化需要5—10年的時間,但這可能是未來人工智能應(yīng)用的一個基本推動者。他表示,合作、有彈性機(jī)器人的用途幾乎是無限的。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
即日-9.16點擊進(jìn)入 >> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實用主義
- 7 騰訊 Q2 財報亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號,AI還有哪些機(jī)會
- 9 蘋果把身家押在Siri上:一場輸不起的自我革命
- 10 共探合作新機(jī)遇!江門市新會區(qū)(深圳)“AI + 機(jī)器人” 產(chǎn)業(yè)對接會成功舉辦