英偉達10億美元投資初創公司!AI創業難度大但機會猶存?
一次AI革命,讓原本名聲不顯的OpenAI一躍成為全球知名企業,估值超過1500億美元。但若討論哪家企業才是AI時代的最大受益者,NVIDIA絕對是唯一答案。
財報數據顯示,2024年第三財季,NVIDIA營收高達350.82億美元,同比增長93.61%,歸母凈利潤193.09億美元,同比增長108.90%,其中數據中心業務營收為308億美元,同比增長高達112%,公司市值更是超越微軟,位列全球第二。
AI企業與NVIDIA屬于互相成就,前者需要后者提供GPU或專業AI計算卡,用于大模型的訓練和推理,他們的需求助力NVIDIA營收、利潤屢創新高。正因如此,NVIDIA也清楚需要付出一定的成本扶持AI公司,培養客戶群體。
據英國《金融時報》報道,剛剛過去的2024年,NVIDIA累計參與了50多輪融資和多筆交易,向AI初創企業累計投資了約10億美元,相較2023年的8.72億美元增長了大約15%。按照這個趨勢,2025年NVIDIA大概率會投資更多AI初創公司。
除了NVIDIA,其他國內外互聯網公司也在不斷增加AI領域的投入,一邊打造自己的AI團隊,一邊投資其他AI公司。對于小型AI公司而言,有機會獲得大企業的投資無疑是好消息,基于這種情況,2024年無數企業瘋狂涌入AI行業。
天眼查數據顯示,2024年國內新增AI相關企業超過50萬家。可在AI技術日漸成熟的今天,進軍AI行業真的還有機會嗎?
“錢”字當頭,AI創業入局難
AI大模型的黑盒特質使其可解釋性和可調試性較弱,對于語義的理解能力、數學邏輯和推理能力,以及可能存在的AI“幻覺”,都是困擾開發者的技術難題。訓練一款成熟可用的大模型,需要招募大量技術人才,去解決各種難題。然而行業的競爭促使企業互相挖墻腳,吸納AI人才的成本不斷飆升。
例如前段時間小米CEO雷軍親自出手,將參與過DeepSeek-V2大模型開發工作的羅福莉挖到了小米。網上甚至有消息稱,小米公司向羅福莉開出了千萬年薪。傳言可能會有些夸張,但羅福莉的年薪恐怕至少是7位數。
人才之外,GPU算力也是壓在AI公司心頭的重擔。仍以小米為例,日前界面新聞爆料稱,小米正在著手打造萬卡算力集群。百度集團執行副總裁、百度智能云事業群總裁沈抖曾表示,一個1.6萬張GPU的集群,采購成本就高達數十億元,更不用說搭建、運營、維護成本。

(圖源:AI生成)
萬卡集群只是開始,若想打造出頂尖AI,還需要購買更多GPU或專業AI計算卡。民生證券計算機首席分析師呂偉表示,以ChatGPT的6億月活數據計算,訓練任務大約需要12萬張A100,推理任務所需約35萬張A100。
為滿足未來AI大模型的訓練和推理需求,OpenAI CEO山姆·奧特曼甚至提出了7萬億美元重塑全球半導體行業的計劃。算力集群的投入堪稱無底洞,最終需要多少才夠,現在任何AI公司都說不出確切數字。要知道,1984年上映的《終結者》電影中,覺醒了自我意識的天網系統,算力規模也僅為每秒60萬億次浮點運算,不如一張RTX 4090。
招募人才和組建算力集群的成本或許很高,但總歸可以承受,更嚴重的問題在于,用于訓練大模型的數據不夠了。原定2024年中后期面世的GPT-5,至今未能完成訓練,主要原因之一就是數據不夠用。為解決數據不足的難題,OpenAI被迫招聘工程師、數學家、物理學家編寫數據,用于訓練大模型。

(圖源:AI生成)
AI大模型的參數量越多,性能上限就越高,但參數量需要大量數據訓練。為訓練GPT-4和GPT-5,OpenAI幾乎耗盡了網上公開的論文、新聞資訊,以及社交平臺上的帖子,甚至因此惹上了官司,被加拿大新聞社、加拿大廣播公司、Torstar、環球郵報等媒體起訴。
倒不是說數據完全被耗盡,只是剩下的數據未經公開,基本在各大公司內部,AI公司難以獲取到。山姆·奧特曼直言,未來訓練一個大模型的成本可能會超過10億美元。
人才、算力、數據三大成本在前,哪怕是互聯網巨頭也倍感壓力,更不用說涌入AI行業的初創公司了。
不過并非沒有低成本訓練大模型的方法,小米開出天價年薪招募羅福莉,目的很可能在于羅福莉的身份——DeepSeek-V2開發工作的參與者。
DeepSeek大獲成功,降本增效不是不行
最近一段時間,AI行業最火的新聞無疑是DeepSeek-V3模型的到來,其低至557.6萬美元的訓練成本,大約只是GPT-4的二十分之一,預計不到GPT-5的二百分之一。經過小雷實測,DeepSeek-V3在文字生成、數學推理等領域的體驗不輸豆包、文心一言、Kimi等國內極負盛名的AI應用。
DeepSeek全新大模型的成功,向其他AI公司傳達了一個信息——訓練大模型的成本可以不用很高。然而有舍必有得,低成本訓練出的大模型,存在一些難以解決的問題。
能夠以極低成本訓練出部分場景體驗媲美豆包、Kimi的大模型,DeepSeek的訣竅在于有三,第一來自MLA架構和MoE架構,前者利用多頭潛在注意力機制,可提取相鄰層的特征并進行壓縮,從而減少計算量,降低大模型訓練所需成本;后者屬于專家混合架構,具備6710億參數,但每次僅激活370億參數,降低了對計算資源的需求。

(圖源:AI生成)
第二是FP8混合精度訓練框架,以降低精度、壓縮鍵值為代價,在盡量不影響模型性能的前提下,大幅節省了顯存和計算資源,可提升訓練速度,降低訓練成本。
第三為模型蒸餾,普通大模型要利用大量數據進行訓練,蒸餾技術以被訓練好的模型為“教師”,篩選出有效數據,去訓練一個“學生”模型,從而降低成本。DeepSeek之所以在開源模型領域享有如此之高的聲譽,并將DeepSeek-V3打造成當前最強開源大模型,蒸餾技術無疑是關鍵因素。
這些技術雖降低了成本,卻以犧牲精度為代價,尤其是蒸餾技術,存在一個極為嚴重的缺陷,即“學生模型”的能力無法超過“教師”模型。追求極致的AI企業不會過度采用蒸餾技術訓練AI,南洋理工大學計算機研究人員王漢卿表示,他認識的一線研究人員,基本沒人在搞模型蒸餾了。
事實上,利用其他AI產出的數據訓練大模型,幾乎所有AI企業都在做,但若過度依賴數據蒸餾,會出現生成數據偏差、喪失多樣性等問題,甚至可能生成無意義的回答。DeepSeek-V3上線后,便出現了回答用戶問題時自稱是ChatGPT的情況。
對此山姆·奧特曼親自回應稱,復制先行者的東西是相對容易的,去做新的、有風險的、有難度的事情是困難的,敢于挑戰困難的研究人員,理所應當獲得更多榮譽,這是世界上最酷的事。盡管沒有明說,但山姆·奧特曼已是在嘲諷DeepSeek-V3抄襲,未來蒸餾技術也可能面臨侵權問題。
無論如何,DeepSeek-V3的成功,都為其他AI公司和考慮入場的企業指出了一條新的道路,通過降低精度、壓縮內容、蒸餾模型,無需數億美元的高昂成本,也能訓練出表現出色的AI大模型。
AI行業,依然是“野心家”的樂園
近十年間,全球最成功的兩大新興企業該是新能源汽車和AI大模型,未來人形機器人有機會進入此隊列。新能源汽車行業的發展歷程,將在AI行業復現,初期參與的企業極多,但經過大浪淘沙,技術實力、管理能力不行的企業會逐漸被淘汰。
AI行業正處于從快速發展期向成熟期過渡的中級發展階段,任何企業都仍具有成長為巨頭的機會。只是能否利用好這些機會,則要看AI公司的技術實力、管理能力、戰略眼光。

(圖源:AI生成)
當前AI行業依然可以入場,但只適合兩類企業,一類是財力雄厚,向行業頂峰進發的企業。此類企業將承擔起引領行業進步的責任,不斷開拓進取,將AI的能力推向高峰。
投入大約100億美元卻沒能生產出新能源汽車的蘋果公司和血虧1100億元的恒馳汽車說明,任何新興行業都存在大量風險,不是錢多就一定能成事。AI行業同樣如此,投入和產出未必成正比。不過風險與機遇總是并存的,做到極致的企業未來才能賺大錢。
另一類企業則是以“夠用就行”為目的,不追求功能特性達到極致的公司,可通過降低精度和蒸餾技術,以較低成本打造體驗不錯的大模型。DeepSeek-V3訓練成本僅557.6萬美元,能夠負擔得起的初創公司不在少數。
至于空有野心卻實力不足的企業或創業者,已不適合現在的AI行業。盡管有NVIDIA、微軟等巨頭向初創企業投資,但那點錢相對于頂級AI大模型的開發工作無異于杯水車薪。AI行業依然是野心家的樂園,只是門檻比過去高了一些,入場需要更加謹慎。
來源:雷科技
原文標題 : 英偉達10億美元投資初創公司!AI創業難度大但機會猶存?
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













