国产无码免费,人妻口爆,国产V在线,99中文精品7,国产成人无码AA精品一,制度丝袜诱惑av,久久99免费麻辣视频,蜜臀久久99精品久久久久久酒店
        訂閱
        糾錯
        加入自媒體

        梁文鋒登《自然》封面,曝DeepSeek增量訓練成本僅29.4萬美元!

        2025-09-19 17:56
        網界
        關注

        文 / 汪淼 美編 / 顧青青 出品 / 網界

        中國團隊登上了《自然》封面。

        9月18日,由DeepSeek團隊研發、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文登上《自然》封面。

        但比“登刊”更狠的是,他們干脆自曝家底,DeepSeek-R1的增量訓練成本,只要29.4萬美元。

        要知道,過去OpenAI、谷歌練個大模型,動不動燒掉幾千萬美元。而DeepSeek只用512張英偉達H800顯卡、耗時80小時,就完成了核心訓練。這筆賬,相當于用買一輛跑車的錢,干出了別人蓋工廠的活。

        更關鍵的是,《自然》親自下場蓋章,在評論報道文章中用了“里程碑式論文揭示DeepSeekAI模型的秘密”、“創造歷史”等詞匯表達了對DeepSeek贊賞和肯定。這幾乎是在打臉整個行業長期以來的“黑箱操作”。

        01 29.4萬美元背后

        當DeepSeek在論文里寫下“29.4萬美元”這個數字時,很多人第一反應是:是不是少寫了個零?

        但數據是實的:512張H800顯卡、80小時訓練、每GPU小時租賃價2美元。而且,這還只是增量成本,是指在已經花掉600萬美元開發的基座模型(DeepSeek-V3Base)之上,做強化學習的開銷。

        為什么這么便宜? 關鍵是他們用了“純強化學習”框架(GRPO)。簡單說,就是只告訴模型“答案對不對”,而不教它“步驟該怎么寫”。模型自己琢磨怎么解題,答對了給獎勵,答錯了就調整。這種“放養式訓練”反而逼出了它的推理能力。

        但便宜也引來質疑。年初就有人猜:是不是偷偷用了OpenAI的GPT-4生成數據來做蒸餾? 否則怎么可能這么低成本達到高性能?

        這次《自然》論文里,DeepSeek直接回應:訓練數據全來自普通網頁和電子書,雖然網上可能混了GPT-4生成的內容,但“絕非故意加入”。他們還補充了去污染流程,光數學題就刪了600萬條可能泄露測試答案的數據。

        02《自然》為什么破例?

        AI論文登《自然》不稀奇,但AlphaGo、AlphaFold都是首發。而DeepSeek-R1的論文1月就發在arXiv上,現在卻還能上封面,《自然》甚至為它配發社論,這幾乎是從未有過的待遇。

        原因很簡單:它是第一個愿意被“扒光”的大模型。8位評審專家提了上百個問題,從“數據是否污染”到“推理步驟是不是瞎編的”,甚至摳到單詞單復數用法。DeepSeek團隊寫了64頁回復,幾乎等于重寫半篇論文。

        比如評審問:“你說模型開源了,但‘開源’定義模糊,到底開了多少?”團隊立刻補上數據鏈接和授權細節。

        還有人擔心:“模型會不會為了拿獎勵亂寫步驟?” 他們馬上加實驗證明“步驟與答案的一致性”。

        這種透明,戳中了AI行業的痛點。過去大模型廠商總說自己“遙遙領先”,但測試數據不公開、訓練方法遮遮掩掩。《自然》社論說得直接:AI宣傳未經證實,可能對社會帶來真實風險。

        而DeepSeek把代碼、數據、訓練日志全攤開,等于告訴行業:以后想讓人信你,先學我“曬數據”。

        03 國產AI芯片的機會來了?

        29.4萬美元的成本,不僅打了歐美巨頭的臉,還可能給國產芯片撕開一道口子。DeepSeek在論文里沒提任何芯片公司,但明眼人都能算賬:如果訓練成本降到原來的十分之一,那是不是用性價比更高的國產芯片也能跑?

        華為昇騰、寒武紀這些企業一直被卡在“生態不足”上,客戶嫌性能不夠穩,不敢大規模用。但如果算法能優化到DeepSeek這個程度,硬件壓力會小很多。

        DeepSeek創始人梁文鋒

        事實上,華為和浙大最近已經聯合發了基于昇騰芯片的DeepSeek-R1-Safe模型,雖然這是另一個項目,但證明了一件事:國產芯片能扛住千億級大模型訓練。

        不過業內人也提醒:這還只是“可能”,不是“必然”。國產芯片真要接住這波機會,還得在軟件生態和穩定性上下硬功夫。

        總結開放、透明才是AI的未來

        DeepSeek這次登上《自然》封面,不只是一個人的成功,也不只是一個公司的成功。它代表中國AI行業真正走到了世界前沿。

        DeepSeek也證明了三件事:第一,大模型不一定靠燒錢,算法優化能大幅降低成本;第二,AI行業不能再閉門吹牛,必須接受同行評審的檢驗;第三,中國團隊有能力從技術追隨者變成規則制定者。

        但DeepSeek的價值不止于“被膜拜”,《人民日報》說得好:“它的最大價值是被超越。”

        如果后續國產模型都能用更低成本、更透明的方式練出來,如果國產芯片能借此打開市場,如果AI研發從此告別“黑箱”走向開放,那今天這篇論文,才會真正變成中國AI的轉折點。

        畢竟,梁文鋒自己說過:“中國AI不能永遠做跟隨者。”現在,他們真的走到了前沿。

               原文標題 : 梁文鋒登《自然》封面,曝DeepSeek增量訓練成本僅29.4萬美元!

        聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

        發表評論

        0條評論,0人參與

        請輸入評論內容...

        請輸入評論/評論長度6~500個字

        您提交的評論過于頻繁,請輸入驗證碼繼續

        暫無評論

        暫無評論

          人工智能 獵頭職位 更多
          掃碼關注公眾號
          OFweek人工智能網
          獲取更多精彩內容
          文章糾錯
          x
          *文字標題:
          *糾錯內容:
          聯系郵箱:
          *驗 證 碼:

          粵公網安備 44030502002758號

          主站蜘蛛池模板: 岛国av在线| 人妻中文在线| 国产精品美女| 不卡的无码AV| 国产XXXX| 欧美Aⅴ| 邵阳县| 人妻窝窝WWW聚色窝| 亚洲熟女视频| 湖州市| 国内精品熟女亚洲精品熟女| 亚洲中文天堂| 丝袜.制服.丝袜.亚洲.日韩.中文 国产制服丝袜在线视频 | 人人操操| 国产人妻人伦AV片三A级做爰| 门头沟区| 国产一区二区三区在线| 高清一区二区三区| 久久巨| 粗大肉大捧一进一出好爽视色大师| 亚洲无码社区| 克山县| 汕尾市| 无码人妻一区二区三区线花季传件| 成人小说一区二区三区| 91网站免费在线观看| 51精品视频| 突泉县| 国产视频拍拍拍| 美女88av| 久久人妻中文字幕| 久久精品中文字幕| 中文字幕无码A片| 高级无码| 长宁区| 亚洲综合图区| 亚洲中文字幕AV在线| 99视频精品| 中文无码人妻少妇| 好吊AV| 午夜黄色影院|