從 Manus 到 GO-1:當(dāng)AI逐漸走入物理世界
2025年3月的中國AI領(lǐng)域無疑是一顆投入平靜湖面的巨石,激起層層巨浪,吸引了全球的目光。先是Manus通用AI Agent以“全球首款執(zhí)行級智能體”的姿態(tài)橫空出世,如同一道耀眼的閃電劃破科技的夜空;緊接著,GO - 1通用具身基座大模型宣布開源,宣稱要“重新定義人機(jī)交互邊界”,似一場風(fēng)暴席卷而來。這兩大技術(shù)的碰撞與競爭,讓人們不禁思考:當(dāng)AI開始從云端走向物理世界,真正參與到現(xiàn)實(shí)的交互與創(chuàng)造中,人類距離真正的智能革命究竟還有多遠(yuǎn)?
Manus:“執(zhí)行級AI Agent”的降維打擊Manus是由中國初創(chuàng)公司Monica.im開發(fā)的全球首款通用型AI智能體,其核心定位是自主執(zhí)行復(fù)雜任務(wù)并交付成果。Manus的出現(xiàn)標(biāo)志著AI智能體從單一任務(wù)執(zhí)行向復(fù)雜決策的跨越,其名稱源自拉丁文“mens et manus”,意為“知行合一”,強(qiáng)調(diào)知識與行動的結(jié)合。
1. 核心能力:從“思考”到“行動”的閉環(huán)
Manus的出現(xiàn),宛如一場技術(shù)革命,打破了傳統(tǒng)AI僅僅作為“工具”的屬性。它不再是被動地等待指令,而是具備了從理解指令到自主拆解任務(wù)、調(diào)用工具、跨平臺執(zhí)行并最終交付完整成果的能力,形成了一個從“思考”到“行動”的完美閉環(huán)。
在金融分析領(lǐng)域,當(dāng)用戶輸入“分析特斯拉股價波動”這樣的指令時,Manus就像一位專業(yè)的金融分析師,能夠自動抓取特斯拉的財報,關(guān)聯(lián)美聯(lián)儲的政策信息,最終生成可視化的報告。這一過程不僅高效,而且精準(zhǔn),大大節(jié)省了金融從業(yè)者的時間和精力。

在教育場景中,教師只需上傳教材,Manus就能自動生成教案、制作PPT、編寫練習(xí)題,甚至還能模擬課堂互動。這對于教育工作者來說,無疑是一個得力的助手,能夠讓他們將更多的精力放在教學(xué)方法的創(chuàng)新和與學(xué)生的互動上。

在企業(yè)級應(yīng)用方面,某跨境電商客戶利用Manus完成了競品分析、廣告投放、物流調(diào)度等全流程工作,效率提升了400%。這一顯著的成效充分展示了Manus在實(shí)際業(yè)務(wù)中的強(qiáng)大執(zhí)行力和價值。

更值得一提的是,Manus在GAIA基準(zhǔn)測試中的表現(xiàn)堪稱驚艷。其綜合得分達(dá)到了86.5%,遠(yuǎn)超OpenAI Deep Research的67.9%。這一數(shù)據(jù)表明,AI終于從“實(shí)驗(yàn)室玩具”進(jìn)化為“職場殺手級助手”,能夠在實(shí)際工作中發(fā)揮重要作用。

2. 技術(shù)底層:通用智能體的“靈魂三要素”
Manus之所以能夠具備如此強(qiáng)大的能力,得益于其通用智能體的“靈魂三要素”。
多模態(tài)感知是Manus的重要特性之一。它能夠兼容文本、圖像、語音等多維度輸入,就像人類擁有多種感官一樣,能夠從不同的渠道獲取信息,從而更全面地理解用戶的需求。
動態(tài)規(guī)劃則是Manus高效執(zhí)行任務(wù)的關(guān)鍵。通過強(qiáng)化學(xué)習(xí),它能夠?qū)崟r調(diào)整任務(wù)的優(yōu)先級,根據(jù)實(shí)際情況靈活安排工作流程,確保任務(wù)能夠以最優(yōu)的方式完成。
云端執(zhí)行是Manus的強(qiáng)大后盾。依托分布式算力網(wǎng)絡(luò),它能夠?qū)崿F(xiàn)7×24小時不間斷作業(yè),無論何時何地,都能為用戶提供及時、高效的服務(wù)。
正如團(tuán)隊核心成員季逸超所言:“Manus不是更聰明的AI,而是更像‘人’的AI。”它的出現(xiàn),讓AI更加貼近人類的思維和行為方式,為人類的工作和生活帶來了更多的便利。
GO - 1:具身智能時代的“全能智囊團(tuán)”
如果說Manus代表了人工智能在工具化應(yīng)用上的突破,那么智元機(jī)器人發(fā)布的GO-1則是具身智能領(lǐng)域的一次重大飛躍。GO-1是全球首個通用具身基座大模型,它開創(chuàng)性地提出了Vision-Language-Latent-Action(ViLLA)架構(gòu)。這一架構(gòu)由VLM(多模態(tài)大模型)和MoE(混合專家)組成,通過深度學(xué)習(xí)和生成式人工智能技術(shù),實(shí)現(xiàn)了視覺、語言和動作的深度融合。

1. ViLLA架構(gòu):從“數(shù)據(jù)模型”到“物理世界的交互接口”
ViLLA架構(gòu)的核心在于彌合圖像-文本輸入與機(jī)器人執(zhí)行動作之間的鴻溝。與傳統(tǒng)的Vision-Language-Action(VLA)架構(gòu)相比,ViLLA通過引入Latent Action Tokens(隱式動作標(biāo)記),顯著提升了模型的動作規(guī)劃和執(zhí)行能力。在實(shí)驗(yàn)中,GO-1在五種不同復(fù)雜度的任務(wù)上表現(xiàn)卓越,成功率比現(xiàn)有最優(yōu)模型提高了32。

2. GO-1的四大創(chuàng)新
(1)人類視頻學(xué)習(xí)
GO-1能夠結(jié)合互聯(lián)網(wǎng)視頻和真實(shí)人類示范進(jìn)行學(xué)習(xí),增強(qiáng)模型對人類行為的理解。
(2)小樣本快速泛化
在極少數(shù)據(jù)甚至零樣本的情況下,GO-1能夠快速泛化到新場景和任務(wù),極大地降低了具身智能的應(yīng)用門。
(3)一腦多形
GO-1能夠靈活部署到不同類型的機(jī)器人本體上,支持多種機(jī)器人形態(tài),展現(xiàn)出極高的通用性和靈活。
(4)持續(xù)進(jìn)化
通過數(shù)據(jù)回流系統(tǒng),GO-1能夠在實(shí)際使用中不斷學(xué)習(xí)和優(yōu)化自身性能,越用越聰。
3. GO-1的應(yīng)用場景
GO-1的推出標(biāo)志著具身智能向通用化、開放化和智能化方向的快速發(fā)展。未來,機(jī)器人將不再局限于實(shí)驗(yàn)室,而是能夠適應(yīng)多變的真實(shí)世界環(huán)。例如,在工業(yè)制造、物流配送、家庭服務(wù)等領(lǐng)域,GO-1能夠通過視覺、語言和動作的深度融合,實(shí)現(xiàn)高效的任務(wù)執(zhí)行。
產(chǎn)業(yè)鏈重構(gòu)與競爭升維 以生成式AI和大模型為代表的新一輪人工智能浪潮正在使廣泛的價值鏈?zhǔn)芤妗@纾懔π枨蟮募ぴ鐾苿恿诵酒驮朴嬎惝a(chǎn)業(yè)升級,數(shù)據(jù)成為核心生產(chǎn)資料,催生數(shù)據(jù)治理和隱私計算市場。同時,智能化應(yīng)用的深化加速了制造、醫(yī)療、內(nèi)容、金融等行業(yè)的轉(zhuǎn)型升級。 從“數(shù)據(jù)模型”到“物理世界的交互接口”
與Manus側(cè)重“執(zhí)行”不同,GO - 1主打“理解與生成”,它的技術(shù)定位是成為物理世界的交互接口。其核心技術(shù)包括多模態(tài)大模型、具身推理和工具學(xué)習(xí)。
多模態(tài)大模型支持圖文音視頻的實(shí)時融合分析,能夠像人類一樣綜合處理多種信息,從而更準(zhǔn)確地理解物理世界中的各種場景和指令。
具身推理通過傳感器數(shù)據(jù)構(gòu)建動態(tài)環(huán)境模型,讓GO - 1能夠感知周圍的環(huán)境變化,并根據(jù)這些變化做出相應(yīng)的決策。
工具學(xué)習(xí)則使GO - 1能夠調(diào)用機(jī)械臂、無人機(jī)等實(shí)體設(shè)備執(zhí)行指令,真正實(shí)現(xiàn)了從虛擬世界到物理世界的跨越。
商業(yè)博弈:中國AI軍團(tuán)的全球突圍戰(zhàn)
Manus派強(qiáng)調(diào)“任務(wù)導(dǎo)向”,通過標(biāo)準(zhǔn)化接口接入現(xiàn)有工具鏈,這種方式適合快速商業(yè)化。它能夠在短時間內(nèi)為企業(yè)和用戶提供高效的服務(wù),滿足市場的需求。
GO - 1派則專注于 “系統(tǒng)級智能”,通過深度硬件協(xié)同與自主決策能力,構(gòu)建物理世界的實(shí)時交互閉環(huán)。它更像是 “嬰兒學(xué)習(xí)”—— 從感知環(huán)境到動作執(zhí)行全鏈路自主進(jìn)化,而非依賴外部工具。例如,GO-1 通過 AgiBot World 百萬真機(jī)數(shù)據(jù)集訓(xùn)練,能在無預(yù)設(shè)場景下理解人類指令并完成倒水、組裝等精細(xì)操作,這種能力在工業(yè)質(zhì)檢、服務(wù)機(jī)器人等領(lǐng)域展現(xiàn)出顛覆性潛力。其與蘑菇車聯(lián)車路云網(wǎng)絡(luò)的結(jié)合,更實(shí)現(xiàn)了從 “單車智能” 到 “城市級智能體” 的躍遷,為自動駕駛、低空物流等場景提供系統(tǒng)級解決方案。
兩者并無優(yōu)劣之分。Manus搶占企業(yè)服務(wù)市場,憑借其強(qiáng)大的執(zhí)行能力和高效的任務(wù)處理能力,為企業(yè)提供全方位的解決方案;GO - 1深耕硬件集成領(lǐng)域,通過與實(shí)體設(shè)備的深度融合,實(shí)現(xiàn)物理世界的智能交互。
政策對AI的支持
在政策層面,中國政府高度重視人工智能的發(fā)展。2025年全國兩會再次強(qiáng)調(diào)“人工智能+”行動,提出要持續(xù)推進(jìn)“人工智能+”,將數(shù)字技術(shù)與制造優(yōu)勢、市場優(yōu)勢更好結(jié)合起來。這一政策導(dǎo)向?qū)槿斯ぶ悄芗夹g(shù)的落地和應(yīng)用提供有力支持。 從“互聯(lián)網(wǎng)+”到“人工智能+”,AI已成為全球新一輪科技革命和產(chǎn)業(yè)變革的核心內(nèi)容。未來,隨著技術(shù)的不斷進(jìn)步和政策的支持,人工智能將在更多領(lǐng)域?qū)崿F(xiàn)突破,推動社會的智能化發(fā)展。 AI的 “具身化” 與 “通用化”
從 Manus 的爭議到 GO-1 的突破,AI 的發(fā)展從未如此貼近現(xiàn)實(shí)。當(dāng)智元機(jī)器人在臨港工廠量產(chǎn)人形機(jī)器人,當(dāng) Manus 的更新預(yù)告引發(fā)期待,我們正站在一個新時代的門檻:AI 不再是屏幕后的代碼,而是能感知、思考、行動的 “數(shù)字生命體”,
正如蘑菇車聯(lián)通過深度整合物理世界實(shí)時數(shù)據(jù)的AI大模型--MogoMind構(gòu)建城市的實(shí)時數(shù)字孿生底座,其通感算網(wǎng)絡(luò)已賦能自動駕駛、低空經(jīng)濟(jì)等領(lǐng)域,為 AI 與物理世界的深度融合提供了基礎(chǔ)設(shè)施支撐。這場技術(shù)革命,或?qū)⒅匦露x人類與世界的交互方式。
具身化是AI發(fā)展的重要方向。AI將從虛擬世界走向物理世界,通過機(jī)器人、無人機(jī)等終端直接參與生產(chǎn)生活。這意味著AI將不再僅僅是人們在屏幕前使用的工具,而是能夠真正融入到人們的生活和工作中,成為人們的伙伴和助手。
通用化也是AI發(fā)展的必然趨勢。單一任務(wù)模型將被基座模型取代,AI系統(tǒng)需同時具備理解、推理、執(zhí)行的綜合能力。這將使AI能夠更加靈活地應(yīng)對各種復(fù)雜的任務(wù)和場景,為人類提供更加全面、高效的服務(wù)。
這一趨勢與馬斯克的Optimus、特斯拉的AI戰(zhàn)略不謀而合。當(dāng)具身智能與通用智能體深度融合,AI或?qū)⒄嬲蔀?“人類的延伸”—— 既能在云端運(yùn)籌帷幄,又能在現(xiàn)實(shí)世界動手創(chuàng)造智能時代的終極圖景 —— 一個虛實(shí)交融、萬物互聯(lián)的實(shí)時數(shù)字孿生世界。
原文標(biāo)題 : 從 Manus 到 GO-1:當(dāng)AI逐漸走入物理世界
發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月20日立即報名>> 【免費(fèi)下載】RISC-V芯片發(fā)展現(xiàn)狀與測試挑戰(zhàn)-白皮書
-
即日-11.25立即下載>>> 費(fèi)斯托白皮書《柔性:汽車生產(chǎn)未來的關(guān)鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術(shù)在線大會
-
11月28日立即下載>> 【白皮書】精準(zhǔn)洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 特斯拉工人被故障機(jī)器人打成重傷,索賠3.6億
- 2 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 3 拐點(diǎn)已至!匯川領(lǐng)跑工控、埃斯頓份額第一、新時達(dá)海爾賦能扭虧為盈
- 4 L3自動駕駛延期,逼出車企技術(shù)自我淘汰
- 5 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 6 機(jī)器人9月大事件|3家國產(chǎn)機(jī)器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 7 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機(jī)還是轉(zhuǎn)機(jī)?
- 8 7倍機(jī)器人大牛股:高管股東套現(xiàn)VS機(jī)構(gòu)兇猛抱團(tuán),該信誰?
- 9 八部門聯(lián)手放行L3自動駕駛!巨頭開始拼搶萬億市場?
- 10 OpenAI發(fā)布的AI瀏覽器,市場為何反應(yīng)強(qiáng)烈?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













