巨頭蜂擁而至,商湯背水一戰
當全球科技巨頭競相押注具身智能這一AI新風口時,中國AI產業的標志性企業商湯科技也吹響了全面進軍的號角。
這家曾以計算機視覺技術聞名、位列"AI四小龍"之首的科技企業,在經歷大模型時代的轉型陣痛后,正試圖通過"大模型+機器人"的戰略組合實現絕地反擊。

圖源來自pixabay圖庫
從密集的資本運作到頂尖人才集結,從技術路線重構到生態聯盟搭建,商湯的具身智能布局已遠不止于簡單的業務拓展,而是一場關乎生死的轉型之戰。
風口上的戰略轉身,商湯為何All in具身智能?
日漸擁擠的具身智能賽道,前有螞蟻集團直接成立子公司“螞蟻靈波科技”,后有美團密集領投它石智航、星海圖,京東連續投資千尋智能、眾擎機器人等企業。
海外戰場同樣硝煙彌漫,谷歌RT-2模型、Figure AI的Helix系統、英偉達的世界模型,均在爭奪物理世界交互的制高點。
作為中國AI產業曾經的標桿企業,商湯與曠視、云從、依圖并稱為"AI四小龍",憑借領先的計算機視覺技術在安防、智慧城市等領域風光無限,2021年登陸港股后,首日市值一度突破1500億港元。
然而進入大模型時代后,這批以視覺技術見長的AI企業集體開始遭遇發展瓶頸。商湯2024年財報顯示,公司全年實現營收37.72億元,凈虧損卻高達43.07億元,虧損額甚至超過營收總額。
同樣慘淡的還有云從科技,其2024年營收同比下滑36.7%,凈虧損擴大至6.96億元;而曠視和依圖則面臨業務收縮,后者甚至關閉了多個城市的辦事處,醫療板塊幾近停擺。
尤其在大模型浪潮下,OpenAI、月之暗面、深度求索等公司憑借語言大模型迅速崛起,而"四小龍"的技術主線仍集中在計算機視覺領域,核心收入依賴安防、交通等政府項目,占比普遍超過70%。
可見,商湯此次戰略轉型的背景實則是迫于生存壓力的背水一戰。
從另一角度來看,商湯的入局,也是一場蓄謀已久的“基因延伸”。據悉,其核心團隊已初步組建完畢,部分來自其原有的智能駕駛業務,另一些則是計算機視覺專家和機器人領域資深從業者。
而這種人才流動也揭示了行業共性。自動駕駛與具身智能在環境感知、實時建模等底層技術上高度相通。畢竟“車就是四個輪子的機器人”,而智能駕駛的算法、仿真平臺在一定程度上,也可以直接遷移至機器人開發。
而且,具身智能(Embodied AI)被視為AI技術“落地化”的關鍵突破口,其核心在于通過機器人等物理實體實現"感知-理解-決策-執行"的閉環交互。
這一概念在2025年政府工作報告中作為未來產業被首次提及,隨即引發資本熱潮,僅上半年國內該領域融資就超過200億元,涉及130起融資事件,遠超2024年全年總和。
行業普遍預測,按照馬斯克提出的愿景,未來人形機器人將成為工業主力,數量有望超越人類,預計達到100億臺至200億臺,形成“不亞于手機的新終端市場”。
商湯選擇此時入局,正是希望借助“大模型+機器人”的復合路徑,將自身在視覺識別、多模態感知和大模型訓練方面的積累轉化為新的增長引擎。
躬身入局的商湯,有自己的“具身智能”方程式
從“看懂世界”的視覺識別,到“思考世界”的多模態大模型,再到即將實現的“動手改造世界”的具身智能系統。商湯科技進軍具身智能絕非一時興起,而是基于其技術積累的漸進式躍遷。
商湯聯合創始人王曉剛帶領的團隊在智能駕駛領域研發的"絕影開悟"系統,已經能夠理解物理規律和學習交通規則,而汽車與機器人在本質上都是具身智能體,這為技術遷移提供了可能。
不僅如此,商湯在技術路線上采取了分階段演進的務實策略。2022年8月,商湯推出家用下棋機器人"元蘿卜",首個家庭消費級人工智能產品,并將視覺算法與機械手深度結合,實現了棋子識別與遮擋環境下的精準抓取,初步構建了"視覺-感知-決策"的閉環框架。
這一產品雖然功能單一,卻標志著商湯開始嘗試突破傳統AI的"開環"局限——從坐在云端"思考"世界,到真正與物理世界互動。
2025年4月,商湯發布"日日新SenseNova V6"多模態大模型,采用混合專家架構(MoE),擁有6000億參數,實現了"長思維鏈×數理能力×推理能力×全局記憶"的綜合提升,特別強化了多模態深度推理能力。
而且,該模型被接入人形機器人"飛燕"接入使用,使其具備全景視界感知、情感交互及心理健康篩查功能,同時還可以進行更自然的思考與表達。
不僅如此,商湯即將發布的具身智能"大腦"平臺,代表著其技術整合的新高度。從目前披露的信息看,該平臺旨在集成先進的感知、視覺導航及多模態交互能力,為機器人和各類智能終端提供強大賦能。
值得注意的是,商湯的轉型布局呈現出鮮明的"三位一體"特征。在資本層面,通過配售新股和分拆業務雙向融資;在技術層面,依托大裝置算力平臺和日日新大模型構建基礎能力;在生態層面,則通過戰略合作與投資并購快速建立產業聯盟。
這種全方位推進的策略既反映了商湯轉型的決心,也暗示了其面臨的時間壓力與競爭態勢。如今,具身智能賽道已經進入第二個發展階段,各個巨頭紛紛入場。商湯必須抓住這一波機器人浪潮的紅利,否則可能錯失逆風翻盤的機會。
巨頭云集的具身智能,商湯勝算幾何?
目前來看,具身智能賽道雖然前景廣闊,但已然成為科技巨頭與創業公司同場競技的殘酷紅海。商湯的入局面臨著來自國內外多維度競爭者的挑戰,這些對手在技術路線、資本實力和生態構建方面各有所長。
全球范圍內,OpenAI與機器人公司Figure AI合作開發通用機器人,谷歌推出具身智能RT-2模型,英偉達則聚焦世界模型和仿真技術。
國內市場中,華為于2025年6月發布包含“大腦”的CloudRobo具身智能平臺;字節跳動Seed團隊在7月22日推出通用機器人模型GR-3;智源研究院則更早發布了跨本體具身大小腦協作框架RoboOS與開源具身大腦RoboBrain。

宇樹科技UnitreeR1(圖源來自財聯社)
與此同時,互聯網巨頭也紛紛加碼。京東領投三家機器人企業;美團連續主導了多個機器人相關的項目融資等等。
相較之下,商湯的核心優勢在于計算機視覺領域的多年積累、多模態大模型的先發布局以及強大的算力基礎設施。視覺信息占人類感知的80%以上,而商湯始終活躍在機器視覺技術前沿,在圖像識別、視頻分析和環境理解方面具有深厚技術儲備。
此外,商湯"日日新"大模型系列在多模態融合方面國內領先,V6版本已實現最長64K思維鏈、10分鐘長視頻理解及深度推理等能力,這為具身智能的認知決策提供了堅實基礎。
而且,23,000PetaFlops的算力規模則使商湯能夠支持大規模仿真訓練和復雜模型迭代,這一基礎設施優勢在短期內難以被超越。
劣勢則在于硬件經驗缺乏、現金流壓力和虧損困局。與特斯拉、華為等擁有成熟硬件供應鏈的企業相比,商湯在機器人本體設計、運動控制和硬件集成方面幾乎從零開始。
雖然通過與傅利葉、松應等企業合作可以部分彌補這一短板,但核心硬件能力的培育仍需要長期投入。在具身智能這一需要長期投入的領域,如何平衡研發投入與盈利預期將成為商湯的重大考驗。
而技術路線的不確定性也是商湯不得不面對的壓力。當前具身智能領域尚未形成統一的技術標準,VLA模型、"大小腦"架構和世界模型三種路線并行發展,各有優劣。
此外,具身智能的Scaling Law(規模法則)與語言模型有所不同,隨著參數增加和數據量擴大,系統性能提升的邊際成本可能更高。商湯需要精準把握技術演進方向,避免資源錯配。
結語
商湯的具身智能布局,本質是將其計算機視覺霸權從“看懂世界”向“改造世界”的終極躍遷。
面對AI四小龍的集體困境——大模型時代的技術脫節、政府項目依賴,商湯選擇以“大模型+機器人”組合發起生死突圍。而此役成敗,不僅關乎企業存亡,更將重塑中國在全球具身智能競賽中的位勢。
作者:土耳其熱氣球
來源:港股研究社
原文標題 : 巨頭蜂擁而至,商湯背水一戰
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













