智元機器人發布GO-1,「稚暉君」摸著DeepSeek過河?
機器人行業的DeepSeek-R1,被智元機器人開發出來了?
華為天才少年計劃的經歷,帶給了「稚暉君」彭志輝極高人氣,也讓他創辦的智元機器人獲得了行業頂級流量。但若技術實力與流量不匹配,最終這些流量難免化為輿論攻擊——就像日前涉嫌營銷用力過猛的Manus一樣。
好在,智元機器人一次又一次展現出了自己的實力,日前其推出全球首個通用具身智能基座大模型智元啟元大模型(Genie Operator-1,以下簡稱:GO-1),并計劃第一季度末對核心用戶開源,允許用戶將其部署到自家機器人上。

(圖源:智元機器人)
在DeepSeek-R1面世之后,全球多個AI公司將旗下的大模型開源,并承認開源方能加速推動AI行業進步。GO-1模型現階段開源程度不如采用MIT開源協議的DeepSeek-R1,但此前智元機器人已將用于訓練GO-1模型的AgiBot World數據集、工具鏈、預訓練模型統統開源,未來很可能將GO-1核心代碼和模型開源。
VLM+MoE,智元帶領機器人奔向AI時代
模型開源智元機器人方能有機會成為機器人行業的DeepSeek,但開源卻不代表一定能夠獲得媲美DeepSeek的地位,一切終究要實力說話。
智元機器人開發的GO-1模型基于Vision-Language-Latent-Action(ViLLA)架構,由多模態大模型(VLM)和混合專家(MoE)組合而成。VLM為具身基座大模型的主干網絡,繼承了上海人工智能實驗室開發的開源大模型InternVL-2B的權重,可實現場景感知和語言理解,并利用互聯網上的視頻和圖片數據訓練自身。該模型還能融合多視角視覺、力覺信號,賦予自身通用場景理解能力,從而實現更多復雜的操作。
MoE則分為隱式規劃器和動作專家兩部分,隱式規劃器可利用互聯網上的人類或跨本體視頻,基于VLM的中間層輸出潛在動作令牌(Latent Action Tokens),形成規劃鏈(Chain of Planning),實現通用的動作理解和規劃。動作專家可借助仿真或真機數據,優化潛在動作令牌的生成和輸出效率,并獲得高精度動作的執行能力。

(圖源:智元機器人)
其具備的動態調節機制,還能實現圖像描述、OCR 解析等任務效率的提升,降低數據標注成本和優化資源分配。
基于ViLLA架構,GO-1模型構建了數字金字塔,最基礎的互聯網純文本、圖文數據,可幫助機器人理解通用知識和場景;第二層的大規模人類或跨本體視頻,可幫助機器人學習人類或其他本體的動作操作模式;更高一層的仿真數據則能夠增強機器人的泛用性;最后由真機示教數據幫助機器人訓練精準動作執行能力。
在模型架構之外,用于訓練模型的數據同樣重要。最新版的AgiBot World包含1001552 條軌跡,覆蓋了家庭、零售、工業、餐廳、辦公五大關鍵場景,是目前全球最大的機器人真機示教數據集。
不同于普通軌跡不超過5秒的時間,AgiBot World中的軌跡跨度可達30秒左右,部分軌跡甚至長達2分鐘。智元機器人官方數據顯示,AgiBot World所采用的預訓練模式,相較谷歌Open X-Embodiment訓練策略平均性能提升30%,相較現有機器人大模型完成復雜操作的平均成功率提高了32%。

(圖源:智元機器人)
與傳統機器人模型相比,GO-1模型在架構、數據、預訓練模式等方面均有所改進,提升了資源利用效率和模型的能力,能夠大幅降低機器人訓練和執行操作所需的成本,作用與DeepSeek-R模型較為相似。二者相比,GO-1模型差的可能只有開源模式。
NVIDIA CEO黃仁勛曾預言,兩三年內機器人行業將迎來重大突破,未來會像汽車一樣普及。在機器人技術從生澀走向成熟的今天,智元機器人也在不斷推動產品量產,日前1000臺機器人量產下線,已面向全球開源的靈犀X1也完成了首批交付,靈犀X2于3月11日在上海發布,功能更加強大。在未來機器人行業的競爭中,GO-1模型或將成為智元機器人的核心競爭力之一。
降低門檻,GO-1要做下一個DeepSeek-R1?
阿加犀智能科技有限公司CEO孫曉剛表示,按照目前機器人行業的發展進程,三五年內機器人的價格降到5萬元以內沒有問題。
5萬元以內的機器人,已處于普通消費者可以接受的范圍,但購買的前提是其功能足夠強大,可以幫助我們處理一些生活瑣事。決定機器人能力的關鍵,在于硬件和智能兩方面,GO-1模型要做的就是提高機器人的智能程度。
ViLLA架構賦予了GO-1模型通過人類視頻學習的能力,互聯網上龐大的視頻資源,都將成為機器人進化的「養料」,讓機器人能夠更高效地完成復雜操作。
其次,小樣本快速泛化特性令GO-1模型可以在數據量極少,甚至零樣本的情況下,泛化到新場景,無需龐大的數據,從而大幅減少訓練成本,降低機器人行業的門檻。
最關鍵的是,GO-1屬于「一腦多形」通用機器人模型,能夠在兩足、輪足等不同類型機器人之間遷移和快速適配。不同類型的機器人可能需要完全不同的AI大模型,用于適配機器人硬件的工作模式,是開發機器人企業的難點之一。GO-1模型打破常規,可以輕松適配各種機器人,無疑能夠進一步降低機器人模型的開發、適配成本。

(圖源:智元機器人)
另外,GO-1模型還具備持續進化能力,日常工作中遇到的問題,數據都會回流至系統,用于機器人的訓練和功能升級。
盡管GO-1模型僅在本月底面向核心用戶開源,但從功能特性不難看出,GO-1已經把「我會開源」寫在了臉上,整個大模型幾乎完全面向提升能力、降低成本兩方面。小樣本快速泛化和一腦多形能力,令實力底蘊不足的機器人企業,也能借助GO-1模型快速開發出適合機器人產品的AI系統,并借助國內日漸成熟的機器人供應鏈實現產品量產。
與新能源汽車行業類似,機器人時代的到來是一次機遇,比亞迪、小鵬、賽力斯等車企已紛紛入場,還有許多知名度不高的小企業加入,究竟哪些企業能夠成長為頭部品牌,暫時無法確定。赫赫有名的宇樹科技有望成為機器人行業的比亞迪,開發GO-1模型的智元機器人則擁有成為「蔚小理」的機會。
同樣的,機器人行業的發展之路,也會有許多企業掉隊。不同的是,新能源汽車行業工業實力的重要性大于AI能力,而機器人領域AI能力的重要性至少持平工業實力,甚至更勝一籌。而且在機器人行業發展過程中,供應鏈將不斷整合,硬件會收斂,機器人最終比拼的是智能化。

(圖源:智元機器人)
正如智元新創技術有限公司研究院執行院長、具身業務部總裁姚卯青所言,對機器人公司,你如果不做大模型,那是屬于沒有未來的機器人,沒有智能化,沒有作業能力只是一個硬件。
智元機器人推出的遠征、靈犀、絕塵等多品類機器人,無法發揮GO-1模型的全部價值,將其開源并允許其他企業修改、部署、商用,方能最大限度挖掘GO-1模型的價值,并起到推動機器人行業發展的作用。
向核心用戶開源模型只是開始,未來GO-1模型很可能面向全行業開源,增強其他機器人企業的實力。開源后的GO-1模型,才能獲得DeepSeek-R1的地位,成為行業發展的推動者。智元機器人自身也是硬件產品開發公司,借助GO-1的聲望,或將進一步打響知名度,并提高產品銷量,而非如現在一般,提到智元機器人和彭志輝,大家首先想到的是華為天才少年計劃出身的身份。
原文標題 : 智元機器人發布GO-1,「稚暉君」摸著DeepSeek過河?
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













