久久AV秘?一区二区三区水生,一区二区三区免费,精品va在线观看

英偉達10億美元投資初創公司！AI創業難度大但機會猶存？

2025-01-03 16:18

DeepSeek珠玉在前。

一次AI革命，讓原本名聲不顯的OpenAI一躍成為全球知名企業，估值超過1500億美元。但若討論哪家企業才是AI時代的最大受益者，NVIDIA絕對是唯一答案。

財報數據顯示，2024年第三財季，NVIDIA營收高達350.82億美元，同比增長93.61%，歸母凈利潤193.09億美元，同比增長108.90%，其中數據中心業務營收為308億美元，同比增長高達112%，公司市值更是超越微軟，位列全球第二。

AI企業與NVIDIA屬于互相成就，前者需要后者提供GPU或專業AI計算卡，用于大模型的訓練和推理，他們的需求助力NVIDIA營收、利潤屢創新高。正因如此，NVIDIA也清楚需要付出一定的成本扶持AI公司，培養客戶群體。

據英國《金融時報》報道，剛剛過去的2024年，NVIDIA累計參與了50多輪融資和多筆交易，向AI初創企業累計投資了約10億美元，相較2023年的8.72億美元增長了大約15%。按照這個趨勢，2025年NVIDIA大概率會投資更多AI初創公司。

除了NVIDIA，其他國內外互聯網公司也在不斷增加AI領域的投入，一邊打造自己的AI團隊，一邊投資其他AI公司。對于小型AI公司而言，有機會獲得大企業的投資無疑是好消息，基于這種情況，2024年無數企業瘋狂涌入AI行業。

天眼查數據顯示，2024年國內新增AI相關企業超過50萬家。可在AI技術日漸成熟的今天，進軍AI行業真的還有機會嗎？

“錢”字當頭，AI創業入局難

AI大模型的黑盒特質使其可解釋性和可調試性較弱，對于語義的理解能力、數學邏輯和推理能力，以及可能存在的AI“幻覺”，都是困擾開發者的技術難題。訓練一款成熟可用的大模型，需要招募大量技術人才，去解決各種難題。然而行業的競爭促使企業互相挖墻腳，吸納AI人才的成本不斷飆升。

例如前段時間小米CEO雷軍親自出手，將參與過DeepSeek-V2大模型開發工作的羅福莉挖到了小米。網上甚至有消息稱，小米公司向羅福莉開出了千萬年薪。傳言可能會有些夸張，但羅福莉的年薪恐怕至少是7位數。

人才之外，GPU算力也是壓在AI公司心頭的重擔。仍以小米為例，日前界面新聞爆料稱，小米正在著手打造萬卡算力集群。百度集團執行副總裁、百度智能云事業群總裁沈抖曾表示，一個1.6萬張GPU的集群，采購成本就高達數十億元，更不用說搭建、運營、維護成本。

顯卡與機房.png

（圖源：AI生成）

萬卡集群只是開始，若想打造出頂尖AI，還需要購買更多GPU或專業AI計算卡。民生證券計算機首席分析師呂偉表示，以ChatGPT的6億月活數據計算，訓練任務大約需要12萬張A100，推理任務所需約35萬張A100。

為滿足未來AI大模型的訓練和推理需求，OpenAI CEO山姆·奧特曼甚至提出了7萬億美元重塑全球半導體行業的計劃。算力集群的投入堪稱無底洞，最終需要多少才夠，現在任何AI公司都說不出確切數字。要知道，1984年上映的《終結者》電影中，覺醒了自我意識的天網系統，算力規模也僅為每秒60萬億次浮點運算，不如一張RTX 4090。

招募人才和組建算力集群的成本或許很高，但總歸可以承受，更嚴重的問題在于，用于訓練大模型的數據不夠了。原定2024年中后期面世的GPT-5，至今未能完成訓練，主要原因之一就是數據不夠用。為解決數據不足的難題，OpenAI被迫招聘工程師、數學家、物理學家編寫數據，用于訓練大模型。

顯卡與機房 (1).png

（圖源：AI生成）

AI大模型的參數量越多，性能上限就越高，但參數量需要大量數據訓練。為訓練GPT-4和GPT-5，OpenAI幾乎耗盡了網上公開的論文、新聞資訊，以及社交平臺上的帖子，甚至因此惹上了官司，被加拿大新聞社、加拿大廣播公司、Torstar、環球郵報等媒體起訴。

倒不是說數據完全被耗盡，只是剩下的數據未經公開，基本在各大公司內部，AI公司難以獲取到。山姆·奧特曼直言，未來訓練一個大模型的成本可能會超過10億美元。

人才、算力、數據三大成本在前，哪怕是互聯網巨頭也倍感壓力，更不用說涌入AI行業的初創公司了。

不過并非沒有低成本訓練大模型的方法，小米開出天價年薪招募羅福莉，目的很可能在于羅福莉的身份——DeepSeek-V2開發工作的參與者。

DeepSeek大獲成功，降本增效不是不行

最近一段時間，AI行業最火的新聞無疑是DeepSeek-V3模型的到來，其低至557.6萬美元的訓練成本，大約只是GPT-4的二十分之一，預計不到GPT-5的二百分之一。經過小雷實測，DeepSeek-V3在文字生成、數學推理等領域的體驗不輸豆包、文心一言、Kimi等國內極負盛名的AI應用。

DeepSeek全新大模型的成功，向其他AI公司傳達了一個信息——訓練大模型的成本可以不用很高。然而有舍必有得，低成本訓練出的大模型，存在一些難以解決的問題。

能夠以極低成本訓練出部分場景體驗媲美豆包、Kimi的大模型，DeepSeek的訣竅在于有三，第一來自MLA架構和MoE架構，前者利用多頭潛在注意力機制，可提取相鄰層的特征并進行壓縮，從而減少計算量，降低大模型訓練所需成本；后者屬于專家混合架構，具備6710億參數，但每次僅激活370億參數，降低了對計算資源的需求。

顯卡與機房 (2).png

（圖源：AI生成）

第二是FP8混合精度訓練框架，以降低精度、壓縮鍵值為代價，在盡量不影響模型性能的前提下，大幅節省了顯存和計算資源，可提升訓練速度，降低訓練成本。

第三為模型蒸餾，普通大模型要利用大量數據進行訓練，蒸餾技術以被訓練好的模型為“教師”，篩選出有效數據，去訓練一個“學生”模型，從而降低成本。DeepSeek之所以在開源模型領域享有如此之高的聲譽，并將DeepSeek-V3打造成當前最強開源大模型，蒸餾技術無疑是關鍵因素。

這些技術雖降低了成本，卻以犧牲精度為代價，尤其是蒸餾技術，存在一個極為嚴重的缺陷，即“學生模型”的能力無法超過“教師”模型。追求極致的AI企業不會過度采用蒸餾技術訓練AI，南洋理工大學計算機研究人員王漢卿表示，他認識的一線研究人員，基本沒人在搞模型蒸餾了。

事實上，利用其他AI產出的數據訓練大模型，幾乎所有AI企業都在做，但若過度依賴數據蒸餾，會出現生成數據偏差、喪失多樣性等問題，甚至可能生成無意義的回答。DeepSeek-V3上線后，便出現了回答用戶問題時自稱是ChatGPT的情況。

對此山姆·奧特曼親自回應稱，復制先行者的東西是相對容易的，去做新的、有風險的、有難度的事情是困難的，敢于挑戰困難的研究人員，理所應當獲得更多榮譽，這是世界上最酷的事。盡管沒有明說，但山姆·奧特曼已是在嘲諷DeepSeek-V3抄襲，未來蒸餾技術也可能面臨侵權問題。

無論如何，DeepSeek-V3的成功，都為其他AI公司和考慮入場的企業指出了一條新的道路，通過降低精度、壓縮內容、蒸餾模型，無需數億美元的高昂成本，也能訓練出表現出色的AI大模型。

AI行業，依然是“野心家”的樂園

近十年間，全球最成功的兩大新興企業該是新能源汽車和AI大模型，未來人形機器人有機會進入此隊列。新能源汽車行業的發展歷程，將在AI行業復現，初期參與的企業極多，但經過大浪淘沙，技術實力、管理能力不行的企業會逐漸被淘汰。

AI行業正處于從快速發展期向成熟期過渡的中級發展階段，任何企業都仍具有成長為巨頭的機會。只是能否利用好這些機會，則要看AI公司的技術實力、管理能力、戰略眼光。

顯卡與機房 (3).png

（圖源：AI生成）

當前AI行業依然可以入場，但只適合兩類企業，一類是財力雄厚，向行業頂峰進發的企業。此類企業將承擔起引領行業進步的責任，不斷開拓進取，將AI的能力推向高峰。

投入大約100億美元卻沒能生產出新能源汽車的蘋果公司和血虧1100億元的恒馳汽車說明，任何新興行業都存在大量風險，不是錢多就一定能成事。AI行業同樣如此，投入和產出未必成正比。不過風險與機遇總是并存的，做到極致的企業未來才能賺大錢。

另一類企業則是以“夠用就行”為目的，不追求功能特性達到極致的公司，可通過降低精度和蒸餾技術，以較低成本打造體驗不錯的大模型。DeepSeek-V3訓練成本僅557.6萬美元，能夠負擔得起的初創公司不在少數。

至于空有野心卻實力不足的企業或創業者，已不適合現在的AI行業。盡管有NVIDIA、微軟等巨頭向初創企業投資，但那點錢相對于頂級AI大模型的開發工作無異于杯水車薪。AI行業依然是野心家的樂園，只是門檻比過去高了一些，入場需要更加謹慎。

來源：雷科技

原文標題 : 英偉達10億美元投資初創公司！AI創業難度大但機會猶存？

DeepSeek OpenAI ChatGPT 大模型英偉達

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞