谷歌:未來機(jī)器人可以邊玩邊學(xué)
據(jù)外媒報(bào)道,近日,谷歌大腦展示了如何讓機(jī)器人沒有目標(biāo)地“玩”也可以變得更聰明。谷歌通過模擬遠(yuǎn)程操縱機(jī)器人獲得了一個數(shù)據(jù)集“Learning from Play data(LfP)”。在遠(yuǎn)程操作中,研究人員讓機(jī)器人用機(jī)械手和機(jī)械臂與現(xiàn)實(shí)世界交互,但是沒有具體的目標(biāo)。
谷歌將這個數(shù)據(jù)集用于系統(tǒng)內(nèi),該系統(tǒng)試圖對這些有趣的動作序列進(jìn)行分類,并將它們映射到一個潛在的空間。同時,系統(tǒng)中的另一個模塊試圖查看潛在空間并提出可以將機(jī)器人從其當(dāng)前狀態(tài)轉(zhuǎn)換到其目標(biāo)狀態(tài)的動作序列。
谷歌將使用這個數(shù)據(jù)集的方法與使用行為克隆技術(shù)等方法做比較,結(jié)果發(fā)現(xiàn)使用LfP數(shù)據(jù)集的機(jī)器人表現(xiàn)更穩(wěn)定,且在大部分任務(wù)中成功率都較高。有趣的是,研究人員還發(fā)現(xiàn),使用LfP數(shù)據(jù)集訓(xùn)練的機(jī)器人在首次失敗后會多次重新嘗試完成任務(wù),且在從未接受過任務(wù)標(biāo)簽訓(xùn)練的情況下,機(jī)器人的潛在規(guī)劃空間會學(xué)會嵌入任務(wù)語義。

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題