Kimi和Minimax,爭奪“下一個DeepSeek”心智


六小龍們渴望一場DeepSeek式的勝利。
原創科技新知 AI新科技組
作者丨櫻木 編輯丨江蘺
近日,在36氪WAVES 舉辦的大會上,一個有趣的環節引發了人們的熱議:主辦方讓Kimi與Minimax兩家的投資人進行了對談。隨著DeepSeek的橫空出世,整個中國大模型的牌局已天翻地覆。行業龍頭的格局,從原來的大模型六小龍,逐漸演變成了今天的基模五強。當六小龍不再是市場的焦點時,安靜很久的Kimi和Minimax在前不久不約而同有了新動作:Kimi開源了編程模型Kimi-Dev,它的第一個Agent Kimi-Researcher深度研究也開啟小范圍測試。而Minimax則開源了首個推理模型Minimax-M1,并完成連續五天包含大模型、視頻生成、音頻生成等多個方向的更加。
從產品側來看,Kimi將重心聚焦到agent,以深度研究為主要方向,似乎有意向金融、學術等方向發力,這條路線雖然已經有了智譜等競爭者,但遠離了以生活服務為主的大廠射程,疊加原本不錯的基礎模型能力,Kimi似乎找到了自己的舒適區。而另一邊,Minimax則似乎想要彌補自身的遺憾,在沒有接入DeepSeek之后,繼續發力全方向的布局。這似乎也意味著,大模型競爭進入下半場之后,更多的變量正在醞釀之中,而從各項評測來看,Kimi與Minimax的新產品,似乎都有著不錯的效果。在沒等來R2之后的緩沖期,六小龍中的代表們,正在試圖攜帶著各自的大招,開啟下半場。而從報道來看,無論是頻繁與DeepSeek撞論文的Kimi,還是曾經和DeepSeek賭同一個技術路徑的Minimax,似乎都帶著一絲不甘心。而在大廠先后加入大模型賽道后,六小龍中,Kimi和Minimax正試圖找到自己的生存方式。從某種程度來說,競爭的模式正在發生改變,而在泡沫消散之后,越來越懂經營的六小龍們,也在期待著下一個周期的開始。
01
Kimi和Minimax接連放大招
“一年前,就是比投放、比用戶,現在則回到技術前沿,回到強認知,我相信反而更適合以技術大牛為核心的創業團隊。因為比投放,其實是大廠的機會,所以我覺得他們狀態還挺好的。”在這次對談上,真格基金合伙人戴雨森在談到Kimi與Minimax時如是說。正如其所言,近日,相較于在教育、醫療等垂類應用場景中爭奪的大廠,Kimi與Minimax似乎更希望在基礎技術上展現自身的底色。6月20日,Kimi官方發布消息,Kimi-Researcher(深度研究),開始小范圍灰度測試。據官方消息透露,模型即Agent,Kimi-Researcher 是基于端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代Agent模型,也是一個專為深度研究任務而生的Agent產品。做為內測用戶,可以看到的是,Kimi這次試圖去打造的就是“高實用性”以及“靠譜”的產品。按照官方的數據,每個任務平均進行23步推理,自主梳理并解決需求,平均規劃74個關鍵詞,找到206個網址,由模型判斷并篩選出信息質量最高的前3.2%內容,剔除冗余、低質信息。報告的平均長度在萬字以上,平均引用約26個高質量、可溯源的信源。很明顯,Kimi此次直指需要低幻覺類的垂類賽道。從小紅書等社交媒體反饋來看,論文黨、甚至如金融、法律等高頻需要深度探索的方向,都對Kimi-researcher有著不錯的評價。
專業評測博主mactalk評價道:深度研究不算什么新創新,但Kimi生成的內容,在信源和形式上確實不錯,Kimi的深度研究功能,除了給到一份分析報告外,還會生成一個網頁。看到網頁的那刻,給人的感受是,網頁也應該成為一種和文本同等重要的交互方式。與此同時,Minimax也用全新的模型在展示自身的肌肉。根據極客公園報道,作為推理模型,Minimax-M1在長上下文理解能力上,是目前包括所有閉源和開源模型在內,能力全球前二的模型,且在訓練和推理成本上有極高的性價比。M1仍然延續著MoE架構,而在注意力機制上和強化學習算法上的創新讓M1鮮明地區別于其他推理模型。模型總參數達到4560億參數,原生支持100萬token的上下文長度輸入,以及目前所有模型中最長的80ktoken的輸出長度。在專業上下文能力的測評中,M1的表現遠超包括DeepSeek-R1-0528和Qwen3-235B在內的所有開源模型,甚至超越OpenAI o3和Claude 4 Opus,僅小幅落后SOTA的Gemini 2.5 Pro。
除了基礎模型的進展,Minimax在agent以及多模態等多個領域也是亮點頻出。“大家最近刷抖音有沒有看到‘吳彥祖教你學英語’?其實是Minimax在提供背后的技術支持。我第一次聽的時候,也難以分辨到底是真人還是AI,直到后來才知道是Minimax的客戶,感嘆這真的挺厲害的。”云啟資本合伙人陳煜提到。實用性超強的agent,能力出眾的大模型,Kimi和Minimax試圖開啟的是一場全方位的競速,而從更深層次上來看,兩家公司更希望表達的則是,打破大眾對于大模型賽道的固有心智。
02
渴望一場DeepSeek式的勝利
相較于DeepSeek的光芒萬丈,不得不說,此刻回頭來看,Kimi與Minimax是兩家曾充滿遺憾的公司。楊植麟清華出身,同時在卡內基梅隆大學(CMU)語言技術研究所(LTI)讀博,導師是蘋果AI負責人Ruslan Salakhutdinov和Google AI首席科學家William W. Cohen,這樣的學術背景,在技術可信度上遠超普通創業者。而且他在循環智能等方面的創業經歷,已經在企業級AI落地方面證明過自己。這更能讓資本相信,這個人不只是懂技術,還會做生意。高頻快速的融資,讓其估值迅速爬升。技術背景,管理經驗,同時具有大量子彈,這讓楊植麟成為前DeepSeek時代的明星。更重要的是,Kimi的第一仗還打的漂亮,把長文本技術提升到了“中國AGI突破口”的高度,精準匹配了資本對其的期待。但不可否定的是,DeepSeek的爆火,一定程度上掩蓋了Kimi的部分聲量。不過,即便是到當下,仍然可以看出,Kimi在技術實力上,仍然不遜于DeepSeek。在基礎研究環節,2月18日,DeepSeek和月之暗面幾乎同時發布了他們各自最新的論文,而主題直接「撞車」—— 都是挑戰Transformer架構最核心的注意力機制,讓它能更高效的處理更長的上下文。而更有趣的是,兩家公司的技術派明星創始人的名字,出現在各自的論文和技術報告里。而在近日,兩者撞車的事件又頻頻發生。在法律、醫療等方向招聘上的相似,潛移默化的讓外界覺得,似乎Kimi仍然是能與DeepSeek并駕齊驅的存在。
而另一邊Minimax的遺憾,則來的更為直接。在媒體的報道中,Minimax其實更早的啟用了與DeepSeek相同的技術路線。2023年下半年,大部分國內大模型廠商還在繼續迭代稠密模型(dense model)之際,Minimax創始人兼CEO閆俊杰就把80%以上的研發和算力資源,投到了一件不確定的事情上—— MoE(Mixture of Exerts 混合專家模型)。2024年1月,Minimax上線的abab6,成為國內首個MoE大模型。此后,MoE架構徹底取代稠密架構,成了大模型領域技術迭代的新方向,而年初爆火出圈的DeepSeek,應用的正是MoE。雖然無法一概而論的將兩者在此維度上進行比較,但可以驗證的卻是兩者間肉眼可見的落差。
客觀來說,與DeepSeek技術實力難分伯仲的Kimi與Minimax,在市場中早已無法得到與之匹配的影響力。而從這個維度上來看,沒有被大廠打敗,而是被DeepSeek超越,也讓兩家在下一個周期即agent的爭奪中,渴望著一場真正意義上的翻身仗。正如戴雨森所言“我們不是因為大模型投資Kimi,而是投資團隊。現在是技術革命的早期,他們仍然是擁有中國最優秀團隊的AI創業公司之一,以及擁有最多資源的AI創業公司之一。如果我們相信AI是一件非常大的事,你有最好的團隊,又有最多資源,仍然能夠做出很多有意思的事來。”而AI的下半場,是否仍會按照當下大廠主導,DeepSeek重點突破的模式演繹,似乎仍然是一道謎題。
03
AI公司的生存邏輯正在重構
進入6月,AI圈似乎達到了比以往更為熱鬧的情景。羅永浩數字人直播帶貨拿下天量成交,夸克與元寶在高考報志愿競逐,同時,豆包上線了AI播客功能,美團高層點了第一杯AI外賣咖啡,AI的想象力與應用正在不斷加速地滲透至生活的各個角落。 這一切的快速演變,似乎讓人看到了紅杉AI峰會中所提到的,下一輪 AI,賣的不是工具,而是收益。但與此同時,對于agent未來演變的辯論也在持續。拾象CEO李廣密曾坦言Agent與當前模型能力的匹配程度。他認為,今天Agent 80%的能力依賴于模型這個引擎。比如,GPT到了3.5,多輪對話的通用范式出現了,Chatbot這種產品形態就行得通了。Cursor的崛起也是因為模型發展到了Claude 3.5的水平,它的代碼補全能力才得以成立。而AI Research Lead鐘凱祺則認為:通用Agent的需求基本上就是信息檢索和輕度代碼編寫這兩類,而GPT-4o已經完成得非常好了。因此,通用Agent市場基本上是大模型公司的主戰場,創業公司很難僅僅通過服務于通用需求來做大。而創業公司基本都聚焦在垂直(Vertical)領域。
回到本文的主角:當Kimi用深度研究Agent叩開垂類專業場景的大門,當Minimax以推理模型M1刷新開源能力邊界,兩家公司的每一步動作都在印證同一個事實:大模型競爭早已超越 “參數比拼” 的初級階段,進入到 “心智占領” 的核心戰場。DeepSeek的崛起證明,在大廠與創業公司的博弈中,技術突破與市場定位的精準耦合,足以重塑行業認知 —— 而這正是Kimi與Minimax此刻最迫切的目標。
從技術路徑看,Kimi押注“垂直 Agent”,試圖用“深度研究”的專業標簽切割出差異化賽道;Minimax則試圖用線性注意力機制打出差異化,通過多模態能力構建全場景滲透的想象空間。兩者的策略差異,本質是對“AI下半場生存法則”的不同解讀:前者選擇在大廠尚未重兵布防的垂類扎根,用“高實用性”對抗大廠的流量優勢;后者則延續“全棧布局”的野心,試圖以技術性價比彌補生態短板。但這場爭奪的關鍵,或許正如戴雨森所言——“投資團隊而非模型”。當 DeepSeek 用技術敘事改寫資本邏輯,Kimi與Minimax的核心競爭力,仍在于創始團隊對技術趨勢的預判能力(如楊植麟對長文本技術的堅持、閆俊杰對MoE架構的提前布局)。在大廠憑借資源優勢加速內卷的當下,創業公司的破局點從來不是 “硬碰硬”,而是像DeepSeek那樣,在某個技術維度建立不可替代的認知優勢,進而占領用戶心智。如今的AI下半場,既是技術落地的“馬拉松”,也是心智認知的“閃電戰”。Kimi與Minimax的每一次開源、每一個Agent的迭代,都是在為 “下一個DeepSeek” 的敘事加碼。而當行業泡沫逐漸消散,真正能穿越周期的,或許正是那些既能在技術深水區扎根,又能在用戶心智中刻下獨特標簽的團隊。這場沒有硝煙的戰爭,才剛剛開始。
參考資料:字母榜,《閆俊杰不甘心》字母榜,《minimax的好日子來了?》王智遠,《Kimi還能找到月之亮面嗎?》鳳凰網財經,《Kimi和DeepSeek又撞車?》暗涌,《一年后,當Kimi和MiniMax投資人再坐到一起》極客公園,《巨頭博弈下,Agent 的機會和價值究竟在哪里?》36氪,《開源還要IPO?MiniMax不想被遺忘在這個夏天》月之暗面,《模型即 Agent,Kimi-Researcher(深度研究)開啟內測》極客公園,《MiniMax-M1 登場,MiniMax 再次證明自己是一家模型驅動的 AI 公司》
- The end -
原文標題 : Kimi和Minimax,爭奪“下一個DeepSeek”心智
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













