亚洲激情偷拍,一区777,丝袜精品字幕

R2模型呼之欲出！「卷王」DeepSeek繼續給巨頭上壓力

2025-02-28 09:44

屬于OpenAI的時代結束了？

聚焦DeepSeek專題banner（補充標題） (1).png

DeepSeek-R1的熱度尚未消散，DeepSeek-R2就要來了？

日前路透社報道稱，三位知情人士透露，原計劃今年5月發布的DeepSeek-R2模型，正在加速開發，或將提前發布，新模型有望可以生成更好的代碼，并且使用英語之外的語言進行推理。對此，DeepSeek母公司幻方量化回應稱，以官方消息為準。

考慮到DeepSeek成立于2023年7月17日，至今不滿兩年時間，已開發出了涵蓋編程、數學推理、大語言、多模態、對話等不同場景的多個模型。今年5月前推出R2模型，屬于DeepSeek大模型的正常更新頻率。從R1模型到R2模型，DeepSeek正在改變AI行業。

巨頭驚慌失措，R1模型創下奇跡

2023年3月OpenAI發布GPT-4后，整個AI行業不但沒有因這款大模型的到來更加活躍，反而顯得有些沉寂。哪怕后續OpenAI接連推出了GPT-4o、o1、Sora等大模型，其他企業也紛紛推出了各種大語言、視頻生成、多模態模型，卻未能再現GPT-3到GPT-4的突破性進展。

直到DeepSeek-R1的到來，仿佛為AI行業注入了活力，讓各行各業都積極擁抱AI和R1模型。R1模型的能力得到證實后，國內手機、電視、PC等行業大量企業紛紛為旗下的產品接入了R1模型。

（圖源：DeepSeek）

以手機行業為例，華為、榮耀、OPPO、vivo率先官宣，為智能助手接入R1模型，小米略作猶豫后也選擇跟進，為超級小愛接入了R1模型。日前著名數碼博主@i冰宇宙爆料稱，三星也在積極推進為國行版機型接入R1模型的工作。

不僅如此，騰訊、百度、360等互聯網企業，雖已組建AI團隊，開發出了自己的大模型，但依然選擇為旗下的AI工具接入R1模型。可見，就連其他AI企業，也承認了R1模型在某些領域領先自己。

更關鍵的是，R1模型誕生之前AI工具雖以免費使用為主，可不乏收費服務的平臺，例如ChatGPT和文心一言。OpenAI為了實現盈利，甚至放棄了開源模式，從OpenAI變成「CloseAI」，百度更是閉源方案的擁躉。

然而在R1模型的沖擊下，這兩家企業也改變了原有路線。百度宣布文心一言將從4月1日起免費為用戶提供服務，并于6月30日正式開源。OpenAI則承諾，免費版ChatGPT在標準模式下可無限制使用GPT-5，其CEO山姆·奧特曼還在X平臺表示，將打造開源項目，并向網友們征集意見，究竟打造仍需在GPU上運行的o3-mini模型，還是能力強大的端側模型。

探究 DeepSeek-R1 訓練成本低的原因.png

（圖源：豆包AI生成）

DeepSeek還通過R1模型證明了通過知識蒸餾、混合并行策略、動態稀疏訓練、即時編譯、層次化稀疏注意力等技術，大幅壓縮AI大模型訓練成本的可能性。過去AI企業訓練大模型，不但需要用到規模龐大的算力集群，還需要大量數據，OpenAI甚至招聘人員編寫數據供大模型訓練所用。馬斯克旗下的xAI為訓練Grok 3模型，不惜搭建了一個具有10萬張GPU的全球最大算力集群。

長此以往，AI未必不會變成互聯網巨頭比拼財力的游戲，最終因數據量的不足進展緩慢。DeepSeek之所以能夠給AI行業帶來巨大的沖擊，能力強、訓練成本低、開源三大因素缺一不可。尤其是采用指令集框架PTX和CUDA、ROCm、OpenCL等底層指令都封裝為統一接口的特性，讓其不再依賴NVIDIA GPU，能夠更加自由的部署在各種設備上。

在R1撬動了AI行業的地基后，DeepSeek并未止步不前，如今R2模型即將到來，或將接力R1模型，進一步改變AI行業。

延續低成本、高性能傳統，R2模型拉滿期待值

R1模型邏輯推理能力不輸字節跳動、阿里巴巴、月之暗面等企業花高成本訓練出的大模型，對標行業領導者OpenAI開發的o1模型。但OpenAI不只有o1模型，ChatGPT專業版會員已能夠使用更強的o1 Pro和o3模型。在R1模型追上o1模型后，R2模型自然要向o3模型發起挑戰。

在動態稀疏架構、量化知識蒸餾、混合專家（MoE）架構與多頭潛在注意力（MLA）等技術的加持下，DeepSeek訓練R2模型的成本有望進一步降低。開發訓練數據與模型參數的共適應系統，則可動態調整數據與模型參數的協同關系，提升機器學習系統的效率、泛化性和適應性。

最近幾天DeepSeek每天都會公開一批開源代碼庫，其公布的DeepGEMM采用FP8通用矩陣乘法，支持稠密和MoE模型，僅300行代碼即可實現超越專家優化的內核，能夠降低AI大模型的推理成本，該技術自然也要被用于R2模型。

探究 DeepSeek-R1 訓練成本低的原因 (1).png

（圖源：豆包AI生成）

R1模型的論文中提到，RL（強化學習）數據的增加，不僅可以提升AI大模型面對復雜任務時的推理能力，還會自發地出現一些復雜行為能力，比如反思和探索不同方法。現階段R1模型所擁有的RL數據較少，未來版本將會大幅增加。

綜合來看，R2模型與R1模型相同，基于V3底座，對標OpenAI o3模型，以常規升級為主。在更多RL數據的支持下，R2模型有望提高推理能力和響應速度，并依靠「反思」能力，生成更準確的推理結果。

未來將誕生的V4，對標OpenAI計劃在今年中期發布的GPT-4.5。基于V4底座+RL開發的R3模型，競爭對手則是OpenAI下一代模型GPT-5。

除了成本和能力方面的提升，R2模型要將把開源理念推向新高度。從o1模型開始，OpenAI強化了閉源理念，不但大模型不再開放，就連思維鏈也被取消，甚至警告用戶使用提示詞誘導模型輸出完整思維鏈會被限制賬號，GPT-4.5將成為OpenAI最后一個獨立發布的基座模型。GPT-5將進入混合模型時代，讓AI大模型徹底變成「黑盒」模式。

探究 DeepSeek-R1 訓練成本低的原因 (2).png