2025年，具身智能終于來到爆發前夜

2025-08-12 17:34

光錐智能

關注

文｜劉俊宏

編｜王一粟

“新老”機器人之間的悲歡并不相通。

當新一代機器人用人形機器人搏擊、遛狗的時候，傳統機器人公司還在用機械臂搬運貨物。一個是人聲鼎沸，一個是冷冷清清。

8月9日，又是一屆世界機器人大會（WRC）在北京開幕。作為歷屆最大的一次展會，本次展覽有200多家國內外機器人企業出席，人形機器人整機企業有50多家。本次展會上共計展出1500多件展品、100多款首發新品，多的一面墻都“簡介”不完。

“大模型解決了機器人操作的問題，現在機器人能夠干活，能真正與物理世界交互了。”

對于機器人這一年間的進化，智澄AI創始人、CEO胡魯輝向光錐智能如此總結說。

冒著北京當天的大雨和水泄不通的人群，光錐智能在現場有三個最直觀的感受。

首先，今年人形機器人是大會的絕對主角。之前大會的A館一般著重展示機器人工業場景應用。今年主辦方特意將宇樹和加速進化兩家人形機器人廠商安排進來“吸引流量”。用于演示新技術的B館，直接被人形機器人占領。會場沒有人形機器人的展臺，觀眾密度肉眼可見的“稀疏”。

其次，今年的人形機器人演示主打“可交互”。去年機器人展會上，不少機器人周圍還“拉著隔離帶”，今年機器人廠商希望消費者上手“摸一摸”。在小人形機器人、機器狗、機器人小玩具的展區，光錐智能看到不少消費者詢價，想要當場下單帶走。

最后，今年大多數機器人廠商的演示著重展現實用價值。機器人已經實現了在工廠、科研教育、醫療養老等場景中的初步探索。

最接地氣的是街頭擺攤場景。大會現場隨處可見各種機器人現制咖啡小攤，還有機器人小酒吧、機器人煎餅果子、機器人零售小店等變種場景。

在工業場景上，率先落地的機器人廠商已經開始強調集群協作的概念。相比去年單薄的“能干活”標簽，今年的機器人開始更多強調機器人與自動化產線結合、電池續航、連續工作時長、回報周期等更落地的數據指標。

實際的落地應用，讓機器人開始進入到量產階段。當光錐智能詢問量產情況時，不少機器人廠商都自豪表示今年有上百臺的出貨量。機器人已經開始滲透到我們的日常生活。

“今年會跟線上門店的商家合作落地100家。消費者線上下單之后，機器人負責分揀商品再交給騎手配送”。銀河通用機器人合伙人傅強向光錐智能介紹稱。

在大會現場，光錐智能還注意到三星的高管和幾家日企的高管在現場到處“觀察”。這意味著，中國的人形機器人將和其他機器人一樣有出海的機遇。

機器人行業的變化，是一個明顯的信號。

在一個技術創新驅動的行業，越是臨近大規模應用，技術和產品的迭代速度就會越快。這是基于前期的積累，也是消費者共識驅動巴斯模型（創新擴散理論）收束的結果。

本次探展，光錐智能也聯系到了銀河通用、優必選、智澄AI、眾擎機器人、魔法原子等多家重點公司的高管，一起全面探討了機器人行業的當下和未來。

2025年的機器人，主打一個能干活

“去年很多機器人都動不了，今年動起來了，可以做一些具體任務。”

在今年世界機器人大會現場，傅強向光錐智能總結著一年間的變化。走過一家家公司展位，光錐智能注意到今年機器人的“花架子”演示少了，與實際商業場景結合的演示多了。

現場機器人演示場景，大概能分為四類，每一類都緊緊圍繞著商業化的主題。

最吸引觀眾眼球的，是演示機器人的動作能力。

對比往年“小規模+定時定點”的機器人演示，今年各家廠商的機器人基本上都不帶停的。動作技術高一些的玩家都在“整活”，宇樹表演機器人格斗，加速進化表演機器人踢球，眾擎和魔法原子搞機器人走秀。圍觀人群里三層外三層，根本擠不進去。還有的廠商把機器人干脆“架”到了跑步機上。

大會上也有一些運動相對能力較弱的玩家。這些機器人的展示模式跟去年差不多，都是簡單展示一下外觀和對話能力。更弱一點的，則是給機器人穿了身衣服。內部身體做成什么樣子，這就不得而知了。

有機器人動作演示的展臺，就有觀眾的圍觀。而圍觀本身，就能產生商業價值。“一臺機器人售價在小幾十萬，目前客戶有紅旗汽車，他們做展示接待用。”在樂聚機器人展臺，工作人員向光錐智能解釋著機器人演示所能帶來的商業價值。

而機器人現階段落地最好的，是隨處可見的零售機器人。

出現頻次最多的是賣咖啡和貨架場景機器人，兩種機器人已經能完全實現自動化經營能力。在賣咖啡的演示中，客戶掃碼下單，機器人自動完成出餐。這跟在線下咖啡店購買咖啡沒有任何區別。貨架零售場景，機器人根據觀眾的選擇，現場分揀拿貨。

此外，現場還有做煎餅果子、自動調酒等的零售場景，這些基本可以認為是“賣咖啡”的變種，都能提供客戶從掃碼到出餐的全流程任務。

值得注意的是，今年零售場景的機器人開始注重實際商業落地的細節。

例如煎餅果子機器人會顯示煎餅的所有狀態，讓消費者買得放心。另外，零售貨架機器人沒有盲目采用雙足運動方案，這樣設計主要是保證工作穩定并兼顧續航。

傅強告訴光錐智能，“輪式的好處是技術相對成熟。一臺機器人搭載1.5度電的電池，就能支持連續工作8個小時。”

與零售場景相對的是，人形機器人在工業場景的應用。

相比去年的單一機器人執行固定任務的演示，今年機器人開始強調“集群協作”概念。今年大會現場上，雖然機器人工作內容還是之前的分揀、搬運、質檢“三件套”，但工作流程有了相互配合的概念。

“工業場景一定要走向集群作業的，單一場景落地一兩臺機器人沒什么意義。”

優必選副總裁、研究院院長焦繼超告訴光錐智能，機器人集群協作代表人形機器人開始融入到現代工業生產體系。在這個過程中，機器人公司也能將應用中遇到的難題，轉化成技術壁壘。“實現集群協作，需要機器人公司花時間深入客戶生產流程，跟客戶溝通，與客戶工業后臺管理系統進行對接。沒有實際落地前，這些配合是很難想象的。” 焦繼超說。

最后一類，則是行業再次上演的拼價格環節。

去年有些展商還對價格“諱莫如深”，今年都自信了許多。雖然買一個零售或工業用途的人形機器人依然成本高昂。但大多數展臺的工作人員都會明確告訴我們，售價具體是幾十萬還是接近百萬。整體來看，今年機器人的售價合理了不少。以導覽和演出類型的機器人為例，7-8萬的成本，跟一個人一年工資差不多。

另一邊，人形機器人又開始了價格戰。去年眾擎就扮演著“價格屠夫”的角色，今年推出的新品選擇“加量不加價”。去年3.85萬能買到一款只有“下半身”的產品，今年的新品是一個完整的人形姿態。

“價格再砍一刀”的秘訣，眾擎機器人聯合創始人任國穩告訴光錐智能， “公司具備全棧自研能力，才能兼顧性能和售價”。

2025年，機器人真正“能干活、能掙錢”了。從今年濃厚的商業化氛圍中，我們能夠清晰地感受到，機器人行業在一年之間“變天了”。

一年了，大模型+機器人終于落地

為何人形機器人能在一年之間，從演示進階到實用？

“主要是大模型能力的提升。這一代機器人技術跟上一代最大的區別，就是‘腦子進化’了。”傅強稱。

這也是眾多機器人廠商的共識。

其中關鍵的VLA模型，可以理解成是用L（語言）對之前傳統的VA模型加了一層對現實世界可泛化、可預測的解釋。

“VLA的泛化能力可以通過視覺輸入直接輸出一個模型實時生成的動作，這就是與之前編程技術最大的區別”。傅強總結說。

例如智元的GO-1大模型可以看作是添加了一層CoT（思維鏈），這跟Figure、星海圖等主打“快慢雙系統”的公司核心設計架構差不多。也有公司認為VLA之上還有世界大模型，胡魯輝告訴光錐智能，“VLA的scaling law已遇到瓶頸，世界模型是未來”。

我們能通過星海圖的家務機器人看到：屏幕左邊，是人類下達的“整理床鋪”指令。在屏幕右邊，是語言大模型實時拆解并生成的當前命令“回到初始位置”。

核心技術路線基本一致，使得各家廠商都選擇將機器人盡量都做成人形的樣子，哪怕這些演示和落地場景跟人形外觀“八竿子打不著”。

人形外觀具有兩個明確的AI訓練優勢。

其一是機器人訓練的數據能隨著硬件升級，實現最大限度的復用。“一些公司現在還做不到雙足，給機器人設計人形的身體，是為了支持后續的泛化訓練”，魔法原子銷售總監田罡向光錐智能解釋稱。

另一層優勢，是統一的大模型能顯著降低機器人廠商的技術開發周期。在眾擎展臺，一位工作人員向光錐智能透露稱，美的近期演示的美羅機器人下半身是基于眾擎SA01研發。不到一年時間，傳統制造業出身的美的，就完全掌握了人形機器人的所有運動能力。大模型大腦加上可組合的身體配件，簡直是把機器人變成了“變形金剛”。

在大模型的訓練下，今年機器人動作也變得更加絲滑。今年機器人雖然也有偶爾摔跤或者手沒拿穩的失誤，但光錐智能注意到，這些機器人的動作已經非常接近人類。以星辰智能為例，在分揀場景中，機器人手、眼、軀干的協同，簡直跟人類“用筷子夾花生”一模一樣。

而借助大模型的泛化能力，VLA技術領先的廠商的機器人更能理解真實世界。

以貨架零售場景為例，機器人能抓的商品種類越多，代表著機器人“大腦”的泛化性更好。京東的場景全都是飲料，機器人抓取的物品類型非常單一。靈境啟元的貨架多了筒裝薯片、瓜子和紙盒包裝的商品，這些商品外包都屬于比較硬的一類。銀河通用的貨架就復雜多了，多了充氣包裝的薯片、小面包、方便面、花生、餅干、辣條、啤酒，整體商品復雜度跟大型超市的零食區相當。