訂閱
糾錯
加入自媒體

機器人們,進“大學(xué)”求“深造”

2025-12-01 15:39
商隱社
關(guān)注

盡管機器人技術(shù)發(fā)展多年,但距離真正意義上的“智能”仍有明顯差距。泛化能力弱、應(yīng)用場景受限、商業(yè)化進程緩慢等問題,始終制約著整個行業(yè)的突破。即便在最新一代機器人身上,“摔跤”“反應(yīng)遲緩”“判斷失誤”等基礎(chǔ)性挑戰(zhàn)依然常見。

深入分析發(fā)現(xiàn),機器人的發(fā)展瓶頸已從硬件轉(zhuǎn)向軟件,最大的挑戰(zhàn)仍然在于 AI 模型的突破。如果將機器人比作人類,硬件相當(dāng)于發(fā)育完全的四肢,而 AI 才是真正的“大腦”,數(shù)據(jù)則是學(xué)習(xí)資料,騰訊云存儲所構(gòu)建的 Data Platform 數(shù)據(jù)平臺,則相當(dāng)于支撐其全面成長的“大學(xué)教育體系”。

帕西尼感知科技,作為國內(nèi)領(lǐng)先的高精度觸覺感知與具身智能核心技術(shù)企業(yè),其 CTO 張恒第在日前的采訪中指出:收集包含視覺、關(guān)節(jié)角度、動作軌跡、語音,以及極為稀缺的觸覺模態(tài)在內(nèi)的人類與物理世界交互的全模態(tài)數(shù)據(jù),是一個非常龐大且復(fù)雜的工程,多方對比后,帕西尼把自己所收集的這些訓(xùn)練機器人所必需的全模態(tài)數(shù)據(jù),送進“騰訊云大學(xué)”。

文 |  涵元編輯 |  浩然

本文為商隱社原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系后臺

機器人為何看著“笨”?

在今年4月的機器人馬拉松大賽上,一臺人形機器人緩慢前進,后面跟著幾十位工程師,他們忙著調(diào)算法、換電池、抗干擾。即便如此,大多數(shù)機器人還是頻繁摔跤,窘態(tài)百出。

這一現(xiàn)象背后,是早在20世紀80年代就由漢斯·莫拉維克等人提出的“莫拉維克悖論”:對人類而言困難的任務(wù)(如復(fù)雜運算),對機器反而容易;而人類輕松完成的動作(如感知與運動),對機器卻異常艱難。

原因在于,前者對于機器來說,是做減法。大語言模型(LLM)等技術(shù)將人類上百萬年積累的知識壓縮到機器里,當(dāng)你與 AI 聊天時,相當(dāng)于你在與人類文明史對話。當(dāng)你與AI比賽時,相當(dāng)于你與更高維度的智力對抗。

而后者對于機器人來說,是做加法。以“拿杯子”這樣的簡單指令舉例,機器人操作起來,要經(jīng)歷6個步驟、13個技術(shù)領(lǐng)域。

機器人對“拿杯子”動作的拆分

帕西尼 CTO 張恒第指出,人類執(zhí)行的每一個動作,均涵蓋觸覺、視覺、關(guān)節(jié)角度、動作軌跡、語音等多維度信息。人類本可輕松完成的任務(wù),對機器人來說卻極為復(fù)雜。

張恒第進一步強調(diào):“機器人與物理世界的每一次交互都產(chǎn)生海量數(shù)據(jù)。以攤煎餅為例,單日數(shù)據(jù)量可達150TB,年數(shù)據(jù)規(guī)模達 PB 級別,傳統(tǒng)本地存儲完全無法承載!彬v訊云存儲 Data Platform 所支撐的采集數(shù)據(jù)上傳、存儲、訓(xùn)練環(huán)節(jié),便成為海量全模態(tài)具身數(shù)據(jù)高效推進產(chǎn)業(yè)躍遷的關(guān)鍵。

機器人也需要“上大學(xué)”

為解決機器人學(xué)習(xí)難題,行業(yè)領(lǐng)先企業(yè)開始將機器人送入“大學(xué)”進行系統(tǒng)訓(xùn)練。與人類不同,機器人的學(xué)習(xí)通過“訓(xùn)練數(shù)據(jù)-植入數(shù)據(jù)”模式完成,騰訊云存儲 Data Platform 數(shù)據(jù)平臺正是這所“大學(xué)”的核心基礎(chǔ)設(shè)施。

我們先來看一下為何過去機器人學(xué)習(xí)不好:

● 一場數(shù)據(jù)饑荒。加州大學(xué)伯克利分校的機器人專家肯·戈德伯(Ken Goldberg)曾指出,人形機器人在技能獲取上,與 AI 聊天機器人存在著天壤之別。其核心癥結(jié)在于一場嚴重的“數(shù)據(jù)饑荒”,二者的差距為十萬年。

● 泛化能力不足。機器人基于大量數(shù)據(jù)驅(qū)動的模式匹配,而非基于物理規(guī)律的理解和預(yù)測。這導(dǎo)致它們無法處理未知場景,無法進行常識推理,更無法在失敗后進行基于理解的反思與調(diào)整。

● 一個模型學(xué)習(xí)了與任務(wù)無關(guān)的特征(如視角、背景)跟動作之間的虛假相關(guān)性,而非理解語言指令與目標(biāo)之間的真正關(guān)系。

比如,你向小孩介紹一只貓,下次遇到其他品種的貓,他也會反應(yīng)出來這是“貓”。但如果你喂養(yǎng)一個機器人,前期需要向他輸入大量貓的照片、類型、特征,訓(xùn)練成百上千次后,機器人才會明白,什么樣的物種,可以稱為貓。

這期間,如果有一只貓長了斑點,機器人就有可能將“斑點”與“貓”聯(lián)系起來,遇到帶斑點的衣服時,機器人也可能認為這是一只貓。

在這個過程中,數(shù)據(jù)量級、質(zhì)量、處理方式,都會對機器人的反應(yīng)造成重要影響。

基于全球頂級的觸覺感知技術(shù),帕西尼自研“人因”具身智能數(shù)據(jù)采集體系,采用“多維觸覺數(shù)據(jù)采集手套 PMEC ”+“空間視覺矩陣”的方式,高效、高質(zhì)地采集機器人所需的與物理世界交互的全維度數(shù)據(jù),用以幫助整個行業(yè)加速實現(xiàn)智能泛化進程。帕西尼選擇了騰訊云存儲 Data Platform 數(shù)據(jù)平臺,張恒第介紹,他們看重騰訊云的點為:

一是海量彈性存儲。騰訊云存儲提供了海量、安全穩(wěn)定、低成本的存儲支持,滿足具身智能行業(yè)對海量統(tǒng)一存儲的要求。自動冷熱數(shù)據(jù)分層,熱數(shù)據(jù)極速響應(yīng),冷數(shù)據(jù)沉降至低成本 COS 對象存儲。

二是模型訓(xùn)練加速。TB/s 級吞吐與亞毫秒級訪問延遲的數(shù)據(jù)處理流水線,消除 GPU 等計算資源的數(shù)據(jù)供給瓶頸,確保算力資源高飽和運轉(zhuǎn),提升大規(guī)模模型訓(xùn)練與推理效率。

三是智能化數(shù)據(jù)治理。提供全局元數(shù)據(jù)索引與語義檢索能力,實現(xiàn)語音、視覺、傳感流等異構(gòu)數(shù)據(jù)的自動關(guān)聯(lián)分析與血緣追溯,提升文件檢索效率,為仿真決策提供高一致性訓(xùn)練樣本,激活多模態(tài)數(shù)據(jù)協(xié)同價值。

“騰訊云的優(yōu)勢在于:可以將數(shù)據(jù)快速加載到分發(fā)系統(tǒng)里并調(diào)取數(shù)據(jù)。工具鏈完整,調(diào)取模型不必借助其他工具。即時反饋,看到模型需要修改處,幫助我們快速迭代。提供良好仿真環(huán)境,讓我們在部署前就能在云上進行大量仿真驗證。安全能力高,有效防止外部攻擊。Data Platform 算力調(diào)度能力強,可以投放大量仿真任務(wù)。我們可以只用幾行簡單的命令,就能便捷地使用各種服務(wù),非常方便。”張恒第說。

在騰訊云“大學(xué)”,數(shù)據(jù)被加工提練為可用“教材”,最后統(tǒng)一輸出給機器人,讓機器人突破本體限制,實現(xiàn)云上進化,正如人突破了肉身限制,實現(xiàn)認知升級。

從“硬件驅(qū)動”到“智能驅(qū)動”:機器人步入“智斗”時代

在機器人進化史上,“硬件先行”曾是行業(yè)共識,但如今形勢已變。培養(yǎng)具備認知與決策能力的“機器人大腦”,不再只是技術(shù)趨勢,更是產(chǎn)業(yè)發(fā)展的必然選擇。

從歷史維度看,缺乏軟件支撐的機器人注定被淘汰。以日本本田公司開發(fā)的阿西莫(ASIMO)為例,這款曾集奔跑、踢球、倒咖啡等技能于一身的機器人,在誕生22年后黯然退場。其根本原因在于,阿西莫每個動作依賴三萬行控制代碼手動編寫,無法適應(yīng)AI驅(qū)動的新時代。相比之下,現(xiàn)代機器人通過 AI 訓(xùn)練,僅用幾小時就能掌握后空翻、打太極等高難度動作,效率與靈活性形成鮮明對比。

帕西尼 CEO 許晉誠指出,中國在機器人硬件制造上已位居全球第一梯隊,但“成年人的身體不能配小孩的腦子”。僅靠硬件性能的堆砌,無法滿足現(xiàn)代產(chǎn)業(yè)對柔性生產(chǎn)、個性化服務(wù)和快速適應(yīng)的需求。

在這一背景下,“智斗”能力成為機器人的核心競爭力。

帕西尼 CTO 張恒第強調(diào):“短期目標(biāo)是持續(xù)迭代帕西尼包括傳感器、靈巧手、人形機器人、數(shù)據(jù)采集系統(tǒng)等觸覺產(chǎn)品矩陣的能力;長期目標(biāo)是通過帶有重要觸覺模態(tài)的全鏈條具身智能核心技術(shù),推動 AI 與物理世界的深度融合,加速具身智能在物理世界中的認知與操作能力進化!痹谶@一進程中,騰訊云提供的存儲與算力支持成為關(guān)鍵基礎(chǔ)設(shè)施。通過其高可用、高并發(fā)的數(shù)據(jù)處理能力,有望降低具身智能研發(fā)的門檻,加速“智能涌現(xiàn)”時刻的到來。

當(dāng)前,機器人廠商正積極構(gòu)建“數(shù)據(jù)飛輪”閉環(huán)——通過實際場景中的數(shù)據(jù)反饋持續(xù)優(yōu)化模型,進而提升機器人的智能水平。帕西尼的 TORA-ONE 機器人已應(yīng)用于醫(yī)療、物流、工業(yè)制造乃至地鐵安檢等多元場景,不同領(lǐng)域的數(shù)據(jù)特性與任務(wù)需求,進一步凸顯了云端訓(xùn)練與迭代的重要性。

如今,在騰訊云存儲構(gòu)建的“大學(xué)”環(huán)境中,機器人正實現(xiàn)從單體智能到群體智能的跨越。當(dāng)機器人從這所“大學(xué)”畢業(yè)之時,就是其真正融入人類生活、開啟智能新紀元的開端。

       原文標(biāo)題 : 機器人們,進“大學(xué)”,求“深造”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號