訂閱
糾錯(cuò)
加入自媒體

2025年,具身智能終于來到爆發(fā)前夜

圖片

文|劉俊宏

編|王一粟

“新老”機(jī)器人之間的悲歡并不相通。

當(dāng)新一代機(jī)器人用人形機(jī)器人搏擊、遛狗的時(shí)候,傳統(tǒng)機(jī)器人公司還在用機(jī)械臂搬運(yùn)貨物。一個(gè)是人聲鼎沸,一個(gè)是冷冷清清。

8月9日,又是一屆世界機(jī)器人大會(huì)(WRC)在北京開幕。作為歷屆最大的一次展會(huì),本次展覽有200多家國內(nèi)外機(jī)器人企業(yè)出席,人形機(jī)器人整機(jī)企業(yè)有50多家。本次展會(huì)上共計(jì)展出1500多件展品、100多款首發(fā)新品,多的一面墻都“簡介”不完。

圖片

“大模型解決了機(jī)器人操作的問題,現(xiàn)在機(jī)器人能夠干活,能真正與物理世界交互了。”

對于機(jī)器人這一年間的進(jìn)化,智澄AI創(chuàng)始人、CEO胡魯輝向光錐智能如此總結(jié)說。

冒著北京當(dāng)天的大雨和水泄不通的人群,光錐智能在現(xiàn)場有三個(gè)最直觀的感受。

首先,今年人形機(jī)器人是大會(huì)的絕對主角。之前大會(huì)的A館一般著重展示機(jī)器人工業(yè)場景應(yīng)用。今年主辦方特意將宇樹和加速進(jìn)化兩家人形機(jī)器人廠商安排進(jìn)來“吸引流量”。用于演示新技術(shù)的B館,直接被人形機(jī)器人占領(lǐng)。會(huì)場沒有人形機(jī)器人的展臺(tái),觀眾密度肉眼可見的“稀疏”。

其次,今年的人形機(jī)器人演示主打“可交互”。去年機(jī)器人展會(huì)上,不少機(jī)器人周圍還“拉著隔離帶”,今年機(jī)器人廠商希望消費(fèi)者上手“摸一摸”。在小人形機(jī)器人、機(jī)器狗、機(jī)器人小玩具的展區(qū),光錐智能看到不少消費(fèi)者詢價(jià),想要當(dāng)場下單帶走。

最后,今年大多數(shù)機(jī)器人廠商的演示著重展現(xiàn)實(shí)用價(jià)值。機(jī)器人已經(jīng)實(shí)現(xiàn)了在工廠、科研教育、醫(yī)療養(yǎng)老等場景中的初步探索。

最接地氣的是街頭擺攤場景。大會(huì)現(xiàn)場隨處可見各種機(jī)器人現(xiàn)制咖啡小攤,還有機(jī)器人小酒吧、機(jī)器人煎餅果子、機(jī)器人零售小店等變種場景。

圖片

在工業(yè)場景上,率先落地的機(jī)器人廠商已經(jīng)開始強(qiáng)調(diào)集群協(xié)作的概念。相比去年單薄的“能干活”標(biāo)簽,今年的機(jī)器人開始更多強(qiáng)調(diào)機(jī)器人與自動(dòng)化產(chǎn)線結(jié)合、電池續(xù)航、連續(xù)工作時(shí)長、回報(bào)周期等更落地的數(shù)據(jù)指標(biāo)。

圖片

實(shí)際的落地應(yīng)用,讓機(jī)器人開始進(jìn)入到量產(chǎn)階段。當(dāng)光錐智能詢問量產(chǎn)情況時(shí),不少機(jī)器人廠商都自豪表示今年有上百臺(tái)的出貨量。機(jī)器人已經(jīng)開始滲透到我們的日常生活。

“今年會(huì)跟線上門店的商家合作落地100家。消費(fèi)者線上下單之后,機(jī)器人負(fù)責(zé)分揀商品再交給騎手配送”。銀河通用機(jī)器人合伙人傅強(qiáng)向光錐智能介紹稱。

圖片

在大會(huì)現(xiàn)場,光錐智能還注意到三星的高管和幾家日企的高管在現(xiàn)場到處“觀察”。這意味著,中國的人形機(jī)器人將和其他機(jī)器人一樣有出海的機(jī)遇。

機(jī)器人行業(yè)的變化,是一個(gè)明顯的信號(hào)。

在一個(gè)技術(shù)創(chuàng)新驅(qū)動(dòng)的行業(yè),越是臨近大規(guī)模應(yīng)用,技術(shù)和產(chǎn)品的迭代速度就會(huì)越快。這是基于前期的積累,也是消費(fèi)者共識(shí)驅(qū)動(dòng)巴斯模型(創(chuàng)新擴(kuò)散理論)收束的結(jié)果。

本次探展,光錐智能也聯(lián)系到了銀河通用、優(yōu)必選、智澄AI、眾擎機(jī)器人、魔法原子等多家重點(diǎn)公司的高管,一起全面探討了機(jī)器人行業(yè)的當(dāng)下和未來。

2025年的機(jī)器人,主打一個(gè)能干活

“去年很多機(jī)器人都動(dòng)不了,今年動(dòng)起來了,可以做一些具體任務(wù)。”

在今年世界機(jī)器人大會(huì)現(xiàn)場,傅強(qiáng)向光錐智能總結(jié)著一年間的變化。走過一家家公司展位,光錐智能注意到今年機(jī)器人的“花架子”演示少了,與實(shí)際商業(yè)場景結(jié)合的演示多了。

現(xiàn)場機(jī)器人演示場景,大概能分為四類,每一類都緊緊圍繞著商業(yè)化的主題。

最吸引觀眾眼球的,是演示機(jī)器人的動(dòng)作能力。

對比往年“小規(guī)模+定時(shí)定點(diǎn)”的機(jī)器人演示,今年各家廠商的機(jī)器人基本上都不帶停的。動(dòng)作技術(shù)高一些的玩家都在“整活”,宇樹表演機(jī)器人格斗,加速進(jìn)化表演機(jī)器人踢球,眾擎和魔法原子搞機(jī)器人走秀。圍觀人群里三層外三層,根本擠不進(jìn)去。還有的廠商把機(jī)器人干脆“架”到了跑步機(jī)上。

圖片

大會(huì)上也有一些運(yùn)動(dòng)相對能力較弱的玩家。這些機(jī)器人的展示模式跟去年差不多,都是簡單展示一下外觀和對話能力。更弱一點(diǎn)的,則是給機(jī)器人穿了身衣服。內(nèi)部身體做成什么樣子,這就不得而知了。

圖片

有機(jī)器人動(dòng)作演示的展臺(tái),就有觀眾的圍觀。而圍觀本身,就能產(chǎn)生商業(yè)價(jià)值。“一臺(tái)機(jī)器人售價(jià)在小幾十萬,目前客戶有紅旗汽車,他們做展示接待用。”在樂聚機(jī)器人展臺(tái),工作人員向光錐智能解釋著機(jī)器人演示所能帶來的商業(yè)價(jià)值。

而機(jī)器人現(xiàn)階段落地最好的,是隨處可見的零售機(jī)器人。

出現(xiàn)頻次最多的是賣咖啡和貨架場景機(jī)器人,兩種機(jī)器人已經(jīng)能完全實(shí)現(xiàn)自動(dòng)化經(jīng)營能力。在賣咖啡的演示中,客戶掃碼下單,機(jī)器人自動(dòng)完成出餐。這跟在線下咖啡店購買咖啡沒有任何區(qū)別。貨架零售場景,機(jī)器人根據(jù)觀眾的選擇,現(xiàn)場分揀拿貨。

此外,現(xiàn)場還有做煎餅果子、自動(dòng)調(diào)酒等的零售場景,這些基本可以認(rèn)為是“賣咖啡”的變種,都能提供客戶從掃碼到出餐的全流程任務(wù)。

圖片

值得注意的是,今年零售場景的機(jī)器人開始注重實(shí)際商業(yè)落地的細(xì)節(jié)。

例如煎餅果子機(jī)器人會(huì)顯示煎餅的所有狀態(tài),讓消費(fèi)者買得放心。另外,零售貨架機(jī)器人沒有盲目采用雙足運(yùn)動(dòng)方案,這樣設(shè)計(jì)主要是保證工作穩(wěn)定并兼顧續(xù)航。

傅強(qiáng)告訴光錐智能,“輪式的好處是技術(shù)相對成熟。一臺(tái)機(jī)器人搭載1.5度電的電池,就能支持連續(xù)工作8個(gè)小時(shí)。”

與零售場景相對的是,人形機(jī)器人在工業(yè)場景的應(yīng)用。

相比去年的單一機(jī)器人執(zhí)行固定任務(wù)的演示,今年機(jī)器人開始強(qiáng)調(diào)“集群協(xié)作”概念。今年大會(huì)現(xiàn)場上,雖然機(jī)器人工作內(nèi)容還是之前的分揀、搬運(yùn)、質(zhì)檢“三件套”,但工作流程有了相互配合的概念。

圖片

“工業(yè)場景一定要走向集群作業(yè)的,單一場景落地一兩臺(tái)機(jī)器人沒什么意義。”

優(yōu)必選副總裁、研究院院長焦繼超告訴光錐智能,機(jī)器人集群協(xié)作代表人形機(jī)器人開始融入到現(xiàn)代工業(yè)生產(chǎn)體系。在這個(gè)過程中,機(jī)器人公司也能將應(yīng)用中遇到的難題,轉(zhuǎn)化成技術(shù)壁壘。“實(shí)現(xiàn)集群協(xié)作,需要機(jī)器人公司花時(shí)間深入客戶生產(chǎn)流程,跟客戶溝通,與客戶工業(yè)后臺(tái)管理系統(tǒng)進(jìn)行對接。沒有實(shí)際落地前,這些配合是很難想象的。” 焦繼超說。

最后一類,則是行業(yè)再次上演的拼價(jià)格環(huán)節(jié)。

去年有些展商還對價(jià)格“諱莫如深”,今年都自信了許多。雖然買一個(gè)零售或工業(yè)用途的人形機(jī)器人依然成本高昂。但大多數(shù)展臺(tái)的工作人員都會(huì)明確告訴我們,售價(jià)具體是幾十萬還是接近百萬。整體來看,今年機(jī)器人的售價(jià)合理了不少。以導(dǎo)覽和演出類型的機(jī)器人為例,7-8萬的成本,跟一個(gè)人一年工資差不多。

另一邊,人形機(jī)器人又開始了價(jià)格戰(zhàn)。去年眾擎就扮演著“價(jià)格屠夫”的角色,今年推出的新品選擇“加量不加價(jià)”。去年3.85萬能買到一款只有“下半身”的產(chǎn)品,今年的新品是一個(gè)完整的人形姿態(tài)。

“價(jià)格再砍一刀”的秘訣,眾擎機(jī)器人聯(lián)合創(chuàng)始人任國穩(wěn)告訴光錐智能, “公司具備全棧自研能力,才能兼顧性能和售價(jià)”。

圖片

2025年,機(jī)器人真正“能干活、能掙錢”了。從今年濃厚的商業(yè)化氛圍中,我們能夠清晰地感受到,機(jī)器人行業(yè)在一年之間“變天了”。

一年了,大模型+機(jī)器人終于落地

為何人形機(jī)器人能在一年之間,從演示進(jìn)階到實(shí)用?

“主要是大模型能力的提升。這一代機(jī)器人技術(shù)跟上一代最大的區(qū)別,就是‘腦子進(jìn)化’了。”傅強(qiáng)稱。

這也是眾多機(jī)器人廠商的共識(shí)。

其中關(guān)鍵的VLA模型,可以理解成是用L(語言)對之前傳統(tǒng)的VA模型加了一層對現(xiàn)實(shí)世界可泛化、可預(yù)測的解釋。

“VLA的泛化能力可以通過視覺輸入直接輸出一個(gè)模型實(shí)時(shí)生成的動(dòng)作,這就是與之前編程技術(shù)最大的區(qū)別”。傅強(qiáng)總結(jié)說。

例如智元的GO-1大模型可以看作是添加了一層CoT(思維鏈),這跟Figure、星海圖等主打“快慢雙系統(tǒng)”的公司核心設(shè)計(jì)架構(gòu)差不多。也有公司認(rèn)為VLA之上還有世界大模型,胡魯輝告訴光錐智能,“VLA的scaling law已遇到瓶頸,世界模型是未來”。

我們能通過星海圖的家務(wù)機(jī)器人看到:屏幕左邊,是人類下達(dá)的“整理床鋪”指令。在屏幕右邊,是語言大模型實(shí)時(shí)拆解并生成的當(dāng)前命令“回到初始位置”。

圖片

核心技術(shù)路線基本一致,使得各家廠商都選擇將機(jī)器人盡量都做成人形的樣子,哪怕這些演示和落地場景跟人形外觀“八竿子打不著”。

圖片

人形外觀具有兩個(gè)明確的AI訓(xùn)練優(yōu)勢。

其一是機(jī)器人訓(xùn)練的數(shù)據(jù)能隨著硬件升級(jí),實(shí)現(xiàn)最大限度的復(fù)用。“一些公司現(xiàn)在還做不到雙足,給機(jī)器人設(shè)計(jì)人形的身體,是為了支持后續(xù)的泛化訓(xùn)練”,魔法原子銷售總監(jiān)田罡向光錐智能解釋稱。

圖片

另一層優(yōu)勢,是統(tǒng)一的大模型能顯著降低機(jī)器人廠商的技術(shù)開發(fā)周期。在眾擎展臺(tái),一位工作人員向光錐智能透露稱,美的近期演示的美羅機(jī)器人下半身是基于眾擎SA01研發(fā)。不到一年時(shí)間,傳統(tǒng)制造業(yè)出身的美的,就完全掌握了人形機(jī)器人的所有運(yùn)動(dòng)能力。大模型大腦加上可組合的身體配件,簡直是把機(jī)器人變成了“變形金剛”。

圖片

在大模型的訓(xùn)練下,今年機(jī)器人動(dòng)作也變得更加絲滑。今年機(jī)器人雖然也有偶爾摔跤或者手沒拿穩(wěn)的失誤,但光錐智能注意到,這些機(jī)器人的動(dòng)作已經(jīng)非常接近人類。以星辰智能為例,在分揀場景中,機(jī)器人手、眼、軀干的協(xié)同,簡直跟人類“用筷子夾花生”一模一樣。

而借助大模型的泛化能力,VLA技術(shù)領(lǐng)先的廠商的機(jī)器人更能理解真實(shí)世界。

以貨架零售場景為例,機(jī)器人能抓的商品種類越多,代表著機(jī)器人“大腦”的泛化性更好。京東的場景全都是飲料,機(jī)器人抓取的物品類型非常單一。靈境啟元的貨架多了筒裝薯片、瓜子和紙盒包裝的商品,這些商品外包都屬于比較硬的一類。銀河通用的貨架就復(fù)雜多了,多了充氣包裝的薯片、小面包、方便面、花生、餅干、辣條、啤酒,整體商品復(fù)雜度跟大型超市的零食區(qū)相當(dāng)。

圖片

“我們用仿真的方法造了百億級(jí)的訓(xùn)練數(shù)據(jù)。不管放什么樣的東西,都可以識(shí)別出來。”

誠如傅強(qiáng)的解釋,基于大量數(shù)據(jù)積累疊加VLA大模型訓(xùn)練,銀河通用機(jī)器人才實(shí)現(xiàn)了更強(qiáng)的泛化理解能力。

不過,也有機(jī)器人廠商認(rèn)為應(yīng)該客觀理解VLA技術(shù)的上限。

焦繼超告訴光錐智能,訓(xùn)練機(jī)器人智能應(yīng)該更重視真實(shí)場景的數(shù)據(jù)。“VLA可能更適合驗(yàn)證探索階段。很多廠商用仿真生成數(shù)據(jù)來訓(xùn)練VLA,這些數(shù)據(jù)缺少真實(shí)情境的隨機(jī)性。”

但無論如何,在大模型對機(jī)器人落地的催化下,今年所有機(jī)器人廠商都達(dá)成了重視軟件的共識(shí)。

任國穩(wěn)向光錐智能坦言道,“剛開始的時(shí)候,我們(眾擎)相對更重視硬件和運(yùn)動(dòng)控制上。但現(xiàn)在我們已經(jīng)投入更多精力在具身能力上。目前在研發(fā)投入上,軟件算法是顯著超過了硬件的。”

“關(guān)鍵還是技術(shù)突破,這樣才能做出真正有商業(yè)化能力的機(jī)器人”。正如胡魯輝所說,機(jī)器人行業(yè)已經(jīng)走到了大規(guī)模商業(yè)化的前夜。

商業(yè)化的前夜,快到洗牌時(shí)刻?

“資本現(xiàn)在很冷靜了,很快就迎來洗牌階段。不能快速落地的廠商,很可能要出問題。”

談到人形機(jī)器人的商業(yè)化競爭,焦繼超向行業(yè)劈頭蓋臉潑了一盆冷水。

另一邊,傅強(qiáng)認(rèn)為領(lǐng)先商業(yè)化的機(jī)器人公司會(huì)率先建立足夠高的壁壘,進(jìn)而達(dá)成“贏者通吃”的局面。“肯定是恒強(qiáng)者恒強(qiáng),后發(fā)的玩家可能會(huì)失去機(jī)會(huì)。”傅強(qiáng)說。

優(yōu)必選和銀河通用,已經(jīng)將商業(yè)化看作機(jī)器人公司生死存亡的關(guān)鍵,而不是唯技術(shù)論。

在本次會(huì)展上,光錐智能感受到不同商業(yè)化階段的公司之間存在比較明顯的差異。

例如在工業(yè)場景,有些機(jī)器人廠商會(huì)強(qiáng)調(diào)機(jī)器人連續(xù)工作時(shí)長、充電還是換電、與真人員工的效益差距等指標(biāo)。而另一些公司講的還是負(fù)重、自由度、動(dòng)作協(xié)同等比較基礎(chǔ)的指標(biāo)。后者的指標(biāo),或許并不是對于工業(yè)用戶最關(guān)心的。

圖片

焦繼超告訴光錐智能,工業(yè)場景客戶的訴求都很直接,“客戶上來先問能不能干活,第二個(gè)問題就是續(xù)航多少。”

對于機(jī)器人公司來說,落地應(yīng)用也能帶來真正意義上的產(chǎn)品迭代,很多硬件設(shè)計(jì)缺陷只有在工廠里面實(shí)際工作才能發(fā)現(xiàn)。例如優(yōu)必選Walker S2的迭代,有一條是讓機(jī)器人的手能直接摸到地面。這樣改動(dòng),是因?yàn)樯弦淮鷻C(jī)器人只能在固定高度搬箱子,而不能直接從地上搬。

在零售場景,商業(yè)化進(jìn)展領(lǐng)先的機(jī)器人公司已經(jīng)“殺瘋了”。

“機(jī)器人已經(jīng)成標(biāo)品了。一個(gè)機(jī)器人一天就能在線上門店里干活,甚至都不需要提前掃描商品。”誠如傅強(qiáng)所言,得益于超高的部署效率,銀河通用的零售機(jī)器人正在快速攻城略地。

零售場景機(jī)器人的落地如此順利,是因?yàn)檫@筆賬很好算。傅強(qiáng)說,O2O的商業(yè)邏輯要求必須24小時(shí)接單營業(yè),維持這樣一個(gè)店鋪就需要2-3個(gè)人換班,機(jī)器人可以減少管理成本。以北京為例,一個(gè)員工到手七八千,對應(yīng)人員開支在1萬元左右。三個(gè)人一年30萬,兩年60萬。批量采購機(jī)器人,價(jià)格也就是在這個(gè)區(qū)間。

“最重要的是讓機(jī)器人解決問題,真正提高生產(chǎn)力。”胡魯輝總結(jié)說。

在大會(huì)最后,光錐智能還問了各家公司一個(gè)尖銳的問題——人形機(jī)器人大量應(yīng)用,是否會(huì)影響到普通打工人的就業(yè)機(jī)會(huì)?

焦繼超坦言稱,“其實(shí)是解決招工難的問題。”

事實(shí)上,傳統(tǒng)工業(yè)、服裝、3C電子這些行業(yè)都需要大量的人來完成組裝。但這些行業(yè),普遍存在招工難和人員動(dòng)不動(dòng)就“提桶跑路”的問題。用工困難的現(xiàn)象,其實(shí)反映出人類并不喜歡這些枯燥且重復(fù)的工作。

為人類分憂,是機(jī)器人自誕生之初就被寄予的厚望。人形機(jī)器人的時(shí)代,已經(jīng)到了。

       原文標(biāo)題 : 2025年,具身智能終于來到爆發(fā)前夜

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)