人形機(jī)器人如何做到:手眼協(xié)同和大小腦協(xié)同?
芝能科技出品
人形機(jī)器人正逐漸從前沿實(shí)驗(yàn)室邁向產(chǎn)業(yè)化落地階段,成為人工智能和智能制造融合的關(guān)鍵技術(shù)代表。
特斯拉 Optimus 的硬件方案提出后,激發(fā)全球人形機(jī)器人行業(yè)快速發(fā)展,中國本土企業(yè)在本體制造、核心零部件、自主算法等多個(gè)層面積極參與,產(chǎn)業(yè)生態(tài)日益豐富。政策助推、產(chǎn)學(xué)研聯(lián)動(dòng)與供應(yīng)鏈的多元演進(jìn)共同推動(dòng)這一技術(shù)群體步入規(guī);A段。
但在實(shí)現(xiàn)類人運(yùn)動(dòng)控制、視覺感知、手眼協(xié)同等方面仍面臨眾多技術(shù)難點(diǎn),人形機(jī)器人從“能用”走向“好用”依然任重道遠(yuǎn)。我們從硬件演進(jìn)、功能實(shí)現(xiàn)、現(xiàn)實(shí)應(yīng)用展開分析,梳理當(dāng)前階段的關(guān)鍵矛盾與發(fā)展趨勢。
01
技術(shù)演進(jìn)
與產(chǎn)業(yè)生態(tài)的迅速成型
人形機(jī)器人的產(chǎn)業(yè)化起點(diǎn)在特斯拉提出 Optimus 硬件設(shè)計(jì)方案之后變得清晰可見。其采用的 14 個(gè)旋轉(zhuǎn)執(zhí)行器和 14 個(gè)直線執(zhí)行器,為行業(yè)標(biāo)準(zhǔn)化設(shè)計(jì)提供了參考框架,也拉高了公眾和行業(yè)對大規(guī)模量產(chǎn)可能性的期待。
在這個(gè)標(biāo)桿的帶動(dòng)下,全球各地開始加速推進(jìn)人形機(jī)器人的開發(fā),中國尤其表現(xiàn)出迅猛發(fā)展態(tài)勢。
國產(chǎn)廠商在形態(tài)設(shè)計(jì)上展現(xiàn)出高度差異化。從典型的雙足+直線+旋轉(zhuǎn)關(guān)節(jié),到雙足+純旋轉(zhuǎn)關(guān)節(jié)結(jié)構(gòu),再到雙足結(jié)合輪式底盤或完全輪式平臺,產(chǎn)業(yè)呈現(xiàn)出多路徑演化趨勢。
這種技術(shù)和結(jié)構(gòu)多樣性背后,是國內(nèi)完整產(chǎn)業(yè)鏈的承載力在支撐著不同技術(shù)方向的快速試錯(cuò)與演化。
圍繞重點(diǎn)產(chǎn)品、關(guān)鍵技術(shù)和典型應(yīng)用場景,規(guī)劃至2027年綜合實(shí)力達(dá)到世界先進(jìn)水平,并輔以產(chǎn)業(yè)基金、創(chuàng)新中心建設(shè)等方式推動(dòng)資源配置優(yōu)化,國家級創(chuàng)新中心已在多地設(shè)立,成為產(chǎn)業(yè)鏈、科研院校和政策體系之間的有效橋梁。
本體廠商構(gòu)成也不再局限于傳統(tǒng)機(jī)器人企業(yè)。科技公司、汽車制造商、AI 創(chuàng)業(yè)公司等紛紛入局。
從宇樹科技的 G1、H1 系列,到小鵬計(jì)劃于 2026 年量產(chǎn)的工業(yè)級人形機(jī)器人,以及智元機(jī)器人的遠(yuǎn)征系列量產(chǎn)進(jìn)展,人形機(jī)器人正由“秀肌肉”的研發(fā)樣機(jī)轉(zhuǎn)向“謀落地”的功能場景適配。
支撐整個(gè)生態(tài)的零部件供應(yīng)體系正在同步演進(jìn)。以往如行星滾柱絲杠、空心杯電機(jī)等技術(shù)門檻較高的零件,在工藝持續(xù)優(yōu)化后也逐步具備量產(chǎn)能力。
標(biāo)準(zhǔn)工業(yè)品如伺服電機(jī)、諧波減速器已被納入大規(guī)模供應(yīng)邏輯,在滿足人形機(jī)器人對輕量化、高精度、高頻率響應(yīng)要求上不斷優(yōu)化。資本持續(xù)涌入核心零部件制造環(huán)節(jié),為后續(xù)產(chǎn)業(yè)放量奠定堅(jiān)實(shí)基礎(chǔ)。
02
核心功能的
技術(shù)挑戰(zhàn)與局部突破
人形機(jī)器人產(chǎn)業(yè)熱度高漲,真正讓機(jī)器人“動(dòng)起來、看得清、抓得準(zhǔn)”的技術(shù)挑戰(zhàn)依舊棘手。
以“大小腦”功能協(xié)同為例,當(dāng)前運(yùn)動(dòng)控制與泛化能力尚未成熟。人形機(jī)器人天生結(jié)構(gòu)復(fù)雜、質(zhì)心高、支撐面積小,在動(dòng)態(tài)平衡控制中遠(yuǎn)較四足結(jié)構(gòu)更加不穩(wěn)定。
控制方法上,無論是 MPC 還是 WBC,都面臨建模復(fù)雜度高與算力消耗巨大的問題。
學(xué)習(xí)方法雖然展示出驚艷的實(shí)驗(yàn)成果,例如強(qiáng)化學(xué)習(xí)可實(shí)現(xiàn)跳舞、踢球等復(fù)雜運(yùn)動(dòng),但受限于環(huán)境泛化能力低、獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)難、容錯(cuò)性差等因素,在真實(shí)場景中的可靠性和穩(wěn)定性遠(yuǎn)未達(dá)標(biāo)。
模仿學(xué)習(xí)雖對泛化控制有所幫助,但數(shù)據(jù)來源質(zhì)量仍未理想。遙操作數(shù)據(jù)復(fù)用性差,動(dòng)捕受限于設(shè)備布置和數(shù)據(jù)量,視頻數(shù)據(jù)則存在解析難題。
大模型方向正在成為機(jī)器人智能的另一個(gè)探索維度。視覺語言模型(VLM)以通用模型能力對抗任務(wù)復(fù)雜性,VLA 架構(gòu)也試圖將知識遷移至運(yùn)動(dòng)指令生成。
但由于大模型對硬件資源需求極高,響應(yīng)延遲長,目前仍停留在任務(wù)拆解、路徑規(guī)劃等認(rèn)知層面,真正的運(yùn)動(dòng)控制仍依賴小腦的高速反饋機(jī)制。
視覺系統(tǒng)作為人形機(jī)器人的“眼睛”,其在復(fù)雜環(huán)境下的穩(wěn)定性和多樣性處理能力成為關(guān)鍵短板。
3D視覺路線雖然豐富,如多目立體視覺、dToF、結(jié)構(gòu)光、激光雷達(dá)等,但各有利弊。成本、精度、環(huán)境適應(yīng)性、安全性之間難以兼得。
比如,結(jié)構(gòu)光適用于室內(nèi)近距離成像,但室外表現(xiàn)差且體積大;激光雷達(dá)精度高但價(jià)格昂貴;單目視覺+深度學(xué)習(xí)成本低卻受制于遮擋和紋理缺失等問題。
服務(wù)機(jī)器人領(lǐng)域已出現(xiàn)相對成熟的解決方案。奧比中光在3D視覺傳感器市場的高占有率即是一例,其產(chǎn)品面向多種機(jī)器人類型,并針對不同場景進(jìn)行了針對性優(yōu)化。
抓取和操作是機(jī)器人能否勝任任務(wù)的核心能力,靈巧手因此成為另一個(gè)技術(shù)高地。當(dāng)前各廠商在手部結(jié)構(gòu)、控制策略、感知能力等方面進(jìn)行深入差異化探索。靈心巧手、雷賽智能等廠商推出多個(gè)自由度和不同任務(wù)類型適配的產(chǎn)品,但仍面臨泛化抓取動(dòng)作穩(wěn)定性不足的問題。
手眼協(xié)同是解決這一困境的關(guān)鍵。僅依賴視覺或觸覺完成精準(zhǔn)操作成功率有限,結(jié)合視覺識別與觸覺反饋實(shí)現(xiàn)動(dòng)態(tài)調(diào)整,已成為提升上肢操作能力的主流路徑。雷賽智能的遙操作訓(xùn)練與帕西尼的模仿策略均在嘗試將人類操作經(jīng)驗(yàn)轉(zhuǎn)移至機(jī)器人身上,為提升泛化能力探索出更多可能性。
小結(jié)
走向?qū)嵱玫娜诵螜C(jī)器人,
需要更多耐心與積累
人形機(jī)器人正站在“走出實(shí)驗(yàn)室”的臨界點(diǎn)。從本體制造、控制系統(tǒng)、核心零部件到應(yīng)用場景拓展,技術(shù)與產(chǎn)業(yè)生態(tài)同步演進(jìn),激發(fā)出前所未有的行業(yè)活力。
人形機(jī)器人真正實(shí)現(xiàn)類人的智能行為、運(yùn)動(dòng)能力與操作能力仍非一日之功。從大小腦系統(tǒng)的分布式控制,到多模態(tài)感知與手眼協(xié)同策略,每一個(gè)技術(shù)模塊的突破都需耗費(fèi)大量資源與時(shí)間。
如何在商業(yè)化進(jìn)程與技術(shù)打磨之間找到平衡,是當(dāng)前每一個(gè)從業(yè)者都必須面對的問題。
原文標(biāo)題 : 人形機(jī)器人如何做到:手眼協(xié)同+大小腦協(xié)同?

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會深圳站
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
精彩回顧立即查看>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 【在線會議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 2 黃仁勛:與雷軍長期合作,共探AI智駕
- 3 阿里首位程序員,“掃地僧”多隆已離職
- 4 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進(jìn)化
- 5 六大國產(chǎn)大模型,誰是最強(qiáng)“金融分析師”?|錦緞評測
- 6 2025年第一支10倍股,來了!
- 7 募資39.85億元!寒武紀(jì)押注大模型芯片與軟件平臺
- 8 國內(nèi)免費(fèi)版Deep Research上線,秘塔AI深度研究嘗試重塑知識工作范式
- 9 清庫存?曝英偉達(dá)H20供應(yīng)有限,且沒有復(fù)產(chǎn)計(jì)劃
- 10 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億