2025年,具身智能終于來到爆發前夜

文|劉俊宏
編|王一粟
“新老”機器人之間的悲歡并不相通。
當新一代機器人用人形機器人搏擊、遛狗的時候,傳統機器人公司還在用機械臂搬運貨物。一個是人聲鼎沸,一個是冷冷清清。
8月9日,又是一屆世界機器人大會(WRC)在北京開幕。作為歷屆最大的一次展會,本次展覽有200多家國內外機器人企業出席,人形機器人整機企業有50多家。本次展會上共計展出1500多件展品、100多款首發新品,多的一面墻都“簡介”不完。

“大模型解決了機器人操作的問題,現在機器人能夠干活,能真正與物理世界交互了。”
對于機器人這一年間的進化,智澄AI創始人、CEO胡魯輝向光錐智能如此總結說。
冒著北京當天的大雨和水泄不通的人群,光錐智能在現場有三個最直觀的感受。
首先,今年人形機器人是大會的絕對主角。之前大會的A館一般著重展示機器人工業場景應用。今年主辦方特意將宇樹和加速進化兩家人形機器人廠商安排進來“吸引流量”。用于演示新技術的B館,直接被人形機器人占領。會場沒有人形機器人的展臺,觀眾密度肉眼可見的“稀疏”。
其次,今年的人形機器人演示主打“可交互”。去年機器人展會上,不少機器人周圍還“拉著隔離帶”,今年機器人廠商希望消費者上手“摸一摸”。在小人形機器人、機器狗、機器人小玩具的展區,光錐智能看到不少消費者詢價,想要當場下單帶走。
最后,今年大多數機器人廠商的演示著重展現實用價值。機器人已經實現了在工廠、科研教育、醫療養老等場景中的初步探索。
最接地氣的是街頭擺攤場景。大會現場隨處可見各種機器人現制咖啡小攤,還有機器人小酒吧、機器人煎餅果子、機器人零售小店等變種場景。

在工業場景上,率先落地的機器人廠商已經開始強調集群協作的概念。相比去年單薄的“能干活”標簽,今年的機器人開始更多強調機器人與自動化產線結合、電池續航、連續工作時長、回報周期等更落地的數據指標。

實際的落地應用,讓機器人開始進入到量產階段。當光錐智能詢問量產情況時,不少機器人廠商都自豪表示今年有上百臺的出貨量。機器人已經開始滲透到我們的日常生活。
“今年會跟線上門店的商家合作落地100家。消費者線上下單之后,機器人負責分揀商品再交給騎手配送”。銀河通用機器人合伙人傅強向光錐智能介紹稱。

在大會現場,光錐智能還注意到三星的高管和幾家日企的高管在現場到處“觀察”。這意味著,中國的人形機器人將和其他機器人一樣有出海的機遇。
機器人行業的變化,是一個明顯的信號。
在一個技術創新驅動的行業,越是臨近大規模應用,技術和產品的迭代速度就會越快。這是基于前期的積累,也是消費者共識驅動巴斯模型(創新擴散理論)收束的結果。
本次探展,光錐智能也聯系到了銀河通用、優必選、智澄AI、眾擎機器人、魔法原子等多家重點公司的高管,一起全面探討了機器人行業的當下和未來。
2025年的機器人,主打一個能干活
“去年很多機器人都動不了,今年動起來了,可以做一些具體任務。”
在今年世界機器人大會現場,傅強向光錐智能總結著一年間的變化。走過一家家公司展位,光錐智能注意到今年機器人的“花架子”演示少了,與實際商業場景結合的演示多了。
現場機器人演示場景,大概能分為四類,每一類都緊緊圍繞著商業化的主題。
最吸引觀眾眼球的,是演示機器人的動作能力。
對比往年“小規模+定時定點”的機器人演示,今年各家廠商的機器人基本上都不帶停的。動作技術高一些的玩家都在“整活”,宇樹表演機器人格斗,加速進化表演機器人踢球,眾擎和魔法原子搞機器人走秀。圍觀人群里三層外三層,根本擠不進去。還有的廠商把機器人干脆“架”到了跑步機上。

大會上也有一些運動相對能力較弱的玩家。這些機器人的展示模式跟去年差不多,都是簡單展示一下外觀和對話能力。更弱一點的,則是給機器人穿了身衣服。內部身體做成什么樣子,這就不得而知了。

有機器人動作演示的展臺,就有觀眾的圍觀。而圍觀本身,就能產生商業價值。“一臺機器人售價在小幾十萬,目前客戶有紅旗汽車,他們做展示接待用。”在樂聚機器人展臺,工作人員向光錐智能解釋著機器人演示所能帶來的商業價值。
而機器人現階段落地最好的,是隨處可見的零售機器人。
出現頻次最多的是賣咖啡和貨架場景機器人,兩種機器人已經能完全實現自動化經營能力。在賣咖啡的演示中,客戶掃碼下單,機器人自動完成出餐。這跟在線下咖啡店購買咖啡沒有任何區別。貨架零售場景,機器人根據觀眾的選擇,現場分揀拿貨。
此外,現場還有做煎餅果子、自動調酒等的零售場景,這些基本可以認為是“賣咖啡”的變種,都能提供客戶從掃碼到出餐的全流程任務。

值得注意的是,今年零售場景的機器人開始注重實際商業落地的細節。
例如煎餅果子機器人會顯示煎餅的所有狀態,讓消費者買得放心。另外,零售貨架機器人沒有盲目采用雙足運動方案,這樣設計主要是保證工作穩定并兼顧續航。
傅強告訴光錐智能,“輪式的好處是技術相對成熟。一臺機器人搭載1.5度電的電池,就能支持連續工作8個小時。”
與零售場景相對的是,人形機器人在工業場景的應用。
相比去年的單一機器人執行固定任務的演示,今年機器人開始強調“集群協作”概念。今年大會現場上,雖然機器人工作內容還是之前的分揀、搬運、質檢“三件套”,但工作流程有了相互配合的概念。

“工業場景一定要走向集群作業的,單一場景落地一兩臺機器人沒什么意義。”
優必選副總裁、研究院院長焦繼超告訴光錐智能,機器人集群協作代表人形機器人開始融入到現代工業生產體系。在這個過程中,機器人公司也能將應用中遇到的難題,轉化成技術壁壘。“實現集群協作,需要機器人公司花時間深入客戶生產流程,跟客戶溝通,與客戶工業后臺管理系統進行對接。沒有實際落地前,這些配合是很難想象的。” 焦繼超說。
最后一類,則是行業再次上演的拼價格環節。
去年有些展商還對價格“諱莫如深”,今年都自信了許多。雖然買一個零售或工業用途的人形機器人依然成本高昂。但大多數展臺的工作人員都會明確告訴我們,售價具體是幾十萬還是接近百萬。整體來看,今年機器人的售價合理了不少。以導覽和演出類型的機器人為例,7-8萬的成本,跟一個人一年工資差不多。
另一邊,人形機器人又開始了價格戰。去年眾擎就扮演著“價格屠夫”的角色,今年推出的新品選擇“加量不加價”。去年3.85萬能買到一款只有“下半身”的產品,今年的新品是一個完整的人形姿態。
“價格再砍一刀”的秘訣,眾擎機器人聯合創始人任國穩告訴光錐智能, “公司具備全棧自研能力,才能兼顧性能和售價”。

2025年,機器人真正“能干活、能掙錢”了。從今年濃厚的商業化氛圍中,我們能夠清晰地感受到,機器人行業在一年之間“變天了”。
一年了,大模型+機器人終于落地
為何人形機器人能在一年之間,從演示進階到實用?
“主要是大模型能力的提升。這一代機器人技術跟上一代最大的區別,就是‘腦子進化’了。”傅強稱。
這也是眾多機器人廠商的共識。
其中關鍵的VLA模型,可以理解成是用L(語言)對之前傳統的VA模型加了一層對現實世界可泛化、可預測的解釋。
“VLA的泛化能力可以通過視覺輸入直接輸出一個模型實時生成的動作,這就是與之前編程技術最大的區別”。傅強總結說。
例如智元的GO-1大模型可以看作是添加了一層CoT(思維鏈),這跟Figure、星海圖等主打“快慢雙系統”的公司核心設計架構差不多。也有公司認為VLA之上還有世界大模型,胡魯輝告訴光錐智能,“VLA的scaling law已遇到瓶頸,世界模型是未來”。
我們能通過星海圖的家務機器人看到:屏幕左邊,是人類下達的“整理床鋪”指令。在屏幕右邊,是語言大模型實時拆解并生成的當前命令“回到初始位置”。

核心技術路線基本一致,使得各家廠商都選擇將機器人盡量都做成人形的樣子,哪怕這些演示和落地場景跟人形外觀“八竿子打不著”。

人形外觀具有兩個明確的AI訓練優勢。
其一是機器人訓練的數據能隨著硬件升級,實現最大限度的復用。“一些公司現在還做不到雙足,給機器人設計人形的身體,是為了支持后續的泛化訓練”,魔法原子銷售總監田罡向光錐智能解釋稱。

另一層優勢,是統一的大模型能顯著降低機器人廠商的技術開發周期。在眾擎展臺,一位工作人員向光錐智能透露稱,美的近期演示的美羅機器人下半身是基于眾擎SA01研發。不到一年時間,傳統制造業出身的美的,就完全掌握了人形機器人的所有運動能力。大模型大腦加上可組合的身體配件,簡直是把機器人變成了“變形金剛”。

在大模型的訓練下,今年機器人動作也變得更加絲滑。今年機器人雖然也有偶爾摔跤或者手沒拿穩的失誤,但光錐智能注意到,這些機器人的動作已經非常接近人類。以星辰智能為例,在分揀場景中,機器人手、眼、軀干的協同,簡直跟人類“用筷子夾花生”一模一樣。
而借助大模型的泛化能力,VLA技術領先的廠商的機器人更能理解真實世界。
以貨架零售場景為例,機器人能抓的商品種類越多,代表著機器人“大腦”的泛化性更好。京東的場景全都是飲料,機器人抓取的物品類型非常單一。靈境啟元的貨架多了筒裝薯片、瓜子和紙盒包裝的商品,這些商品外包都屬于比較硬的一類。銀河通用的貨架就復雜多了,多了充氣包裝的薯片、小面包、方便面、花生、餅干、辣條、啤酒,整體商品復雜度跟大型超市的零食區相當。

“我們用仿真的方法造了百億級的訓練數據。不管放什么樣的東西,都可以識別出來。”
誠如傅強的解釋,基于大量數據積累疊加VLA大模型訓練,銀河通用機器人才實現了更強的泛化理解能力。
不過,也有機器人廠商認為應該客觀理解VLA技術的上限。
焦繼超告訴光錐智能,訓練機器人智能應該更重視真實場景的數據。“VLA可能更適合驗證探索階段。很多廠商用仿真生成數據來訓練VLA,這些數據缺少真實情境的隨機性。”
但無論如何,在大模型對機器人落地的催化下,今年所有機器人廠商都達成了重視軟件的共識。
任國穩向光錐智能坦言道,“剛開始的時候,我們(眾擎)相對更重視硬件和運動控制上。但現在我們已經投入更多精力在具身能力上。目前在研發投入上,軟件算法是顯著超過了硬件的。”
“關鍵還是技術突破,這樣才能做出真正有商業化能力的機器人”。正如胡魯輝所說,機器人行業已經走到了大規模商業化的前夜。
商業化的前夜,快到洗牌時刻?
“資本現在很冷靜了,很快就迎來洗牌階段。不能快速落地的廠商,很可能要出問題。”
談到人形機器人的商業化競爭,焦繼超向行業劈頭蓋臉潑了一盆冷水。
另一邊,傅強認為領先商業化的機器人公司會率先建立足夠高的壁壘,進而達成“贏者通吃”的局面。“肯定是恒強者恒強,后發的玩家可能會失去機會。”傅強說。
優必選和銀河通用,已經將商業化看作機器人公司生死存亡的關鍵,而不是唯技術論。
在本次會展上,光錐智能感受到不同商業化階段的公司之間存在比較明顯的差異。
例如在工業場景,有些機器人廠商會強調機器人連續工作時長、充電還是換電、與真人員工的效益差距等指標。而另一些公司講的還是負重、自由度、動作協同等比較基礎的指標。后者的指標,或許并不是對于工業用戶最關心的。

焦繼超告訴光錐智能,工業場景客戶的訴求都很直接,“客戶上來先問能不能干活,第二個問題就是續航多少。”
對于機器人公司來說,落地應用也能帶來真正意義上的產品迭代,很多硬件設計缺陷只有在工廠里面實際工作才能發現。例如優必選Walker S2的迭代,有一條是讓機器人的手能直接摸到地面。這樣改動,是因為上一代機器人只能在固定高度搬箱子,而不能直接從地上搬。
在零售場景,商業化進展領先的機器人公司已經“殺瘋了”。
“機器人已經成標品了。一個機器人一天就能在線上門店里干活,甚至都不需要提前掃描商品。”誠如傅強所言,得益于超高的部署效率,銀河通用的零售機器人正在快速攻城略地。
零售場景機器人的落地如此順利,是因為這筆賬很好算。傅強說,O2O的商業邏輯要求必須24小時接單營業,維持這樣一個店鋪就需要2-3個人換班,機器人可以減少管理成本。以北京為例,一個員工到手七八千,對應人員開支在1萬元左右。三個人一年30萬,兩年60萬。批量采購機器人,價格也就是在這個區間。
“最重要的是讓機器人解決問題,真正提高生產力。”胡魯輝總結說。
在大會最后,光錐智能還問了各家公司一個尖銳的問題——人形機器人大量應用,是否會影響到普通打工人的就業機會?
焦繼超坦言稱,“其實是解決招工難的問題。”
事實上,傳統工業、服裝、3C電子這些行業都需要大量的人來完成組裝。但這些行業,普遍存在招工難和人員動不動就“提桶跑路”的問題。用工困難的現象,其實反映出人類并不喜歡這些枯燥且重復的工作。
為人類分憂,是機器人自誕生之初就被寄予的厚望。人形機器人的時代,已經到了。
原文標題 : 2025年,具身智能終于來到爆發前夜
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













