視頻生成模型大盤點:誰能定義下一代內容?

你被AI視頻包圍了嗎?
新眸原創·作者 | 簡瑜
過去兩個月,不少人被一段“動物跳水”短視頻刷了屏——在標準跳水臺上,大象、小豬、柯基輪番登場,以高難度的動作跳入水中,甚至耳邊還會伴隨有專業的賽事解說和人群歡呼,從動作編排到入水細節,視頻的逼真程度堪比電影特效。
不僅是“動物跳水”,諸如動物擬人化情景演繹、切割不同材質物品的解壓視頻等一類AI生成視頻,早已開始席卷抖音、小紅書、B站等各大內容平臺。
而這樣的視效水平,過去只存在于制作精良的影視作品中。
在這些視頻背后,不僅形成了圍繞“腳本制作——關鍵幀創作——視頻生成”的一連串工作流,甚至還催生出一批靠AI視頻創作變現的“數字導演”。
事實上,早在2022年,市面上就開始出現了一系列AI生成視頻,但當時的視頻畫面,往往存在失真、怪異、觀感差等各種問題,只在小范圍內有所傳播。
轉折點出現在2024年。OpenAI在二月發布Sora,以DiT(Diffusion + Transformer)架構為核心,突破了視頻生成在時長、清晰度、邏輯一致性等方面的瓶頸,讓“AI生成視頻”第一次真正具備了走向大眾市場的可能。
之后越來越多的廠商開始借鑒DiT或其他混合模型架構的模式,陸續發布對標 Sora 的閉源模型產品,如24年6月推出的Runway Gen-3、Luma Dream Machine;7月底全面上線的快手可靈等。
時間來到下半年,視頻生成類模型更是呈現了井噴式的增長。阿里、字節等巨頭紛紛押注,智譜、MiniMax等創業公司也快速跟進。曾經因技術瓶頸被質疑的AI視頻,儼然已經成為了AI模型商業化最擁擠的賽道之一。

01 大小廠“諸侯混戰”各自的牌面有多大?
與已經經歷三年演進和淘洗的大語言模型不同,無論是性能表現還是市場格局,AI視頻生成模型仍處在“諸侯割據”的早期階段。
自2024年起迎來密集爆發后,這一賽道在模型能力、用戶心智乃至具體落地場景上,都尚未形成類似ChatGPT、Claude、Gemini等在LLM領域的頭部壟斷格局。
目前,視頻生成模型雖尚未建立統一的評測體系,但“時序一致性”“幀畫質”“提示詞遵循度”“生成穩定性”等,往往成為通用測評關鍵詞。而從多個測評榜單的變化趨勢來看,各個模型之間仍存在較為明顯的排名波動,領先優勢尚未固化。
以今年4月和7月的AGI-Eval(由多所國內頂尖高校和研究機構聯合發布)榜單為例,僅僅三個月時間,前十排名便發生大幅洗牌,能維持榜上位置的僅剩Pika 1.5、MiniMax的 Video-01、愛詩科技的PixVerse V4。而其他原本上榜的模型,或被自家迭代版本替代,或已被后來者趕超。
值得一提的是,榜單上除了有阿里、字節等互聯網大廠,minimax、愛詩科技等創業公司也赫然在列,且國內廠商的出現率明顯略高于國外廠商。


圖片來源:AGI-Eval官網
另一方面,由于模型生成路徑的不同,文生視頻(Text-to-Video)與圖生視頻(Image-to-Video)在測評維度上也存在較大差異。據國際測評機構Artificial Analysis今年7月的榜單,僅有一半模型能同時躋身兩類前十,也進一步說明當前的模型能力仍處于尚未定型的快速演進期。



圖片來源:Artificial Analysis官網(截止2025.8.6)
當下,有不少聲音認為大語言模型已進入“技術平臺期”。GPT-5遲遲未能發布、Claude 4經歷長達11個月的版本跨度、DeepSeek新產品遲遲未現……相較之下,在視頻生成模型中,模型迭代仍處于初期向成熟過度的爆發地段,大廠與創業公司都在以2至4個月的頻率推陳出新。
以快手可靈為例,從2023年6月上線至今,平均不到兩個月就推出了一次新功能;2025年上半年更是完成了從1.6到2.1之間的兩次模型大版本迭代。Minimax旗下的海螺,自從去年8月上線以后,也在三個月內實現了三次迭代,并于今年6月再次推出新模型海螺02。
盡管整體格局尚未完全明朗,但就國內廠商而言,近半年以來,快手、字節、MiniMax、愛詩科技等在各類評測中的排名基本都能維持在前10之列,位列第一梯隊。
這一趨勢同樣體現在用戶側的使用排名中。據POE榜單顯示,快手可靈、MiniMax海螺長期市場份額位于前列。而字節即夢由于新版本上線時間較晚(2025年6月),在5月榜單中尚未露面。

圖片來源:Poe,《報告:2025年春季人工智能模型使用趨勢》
02 AI視頻生成的爆發式崛起:內容土壤、成本革命與平臺競速
某種程度上說,AI視頻生成之所以能在近一年時間里迎來井噴式增長,是一種“天時地利人和”的結果。
除了Sora帶來的技術瓶頸突破,視頻內容的持續擴張,構成了AI視頻落地最堅實的“土壤”。據QuestMobile數據,截至2024年9月,中國移動視頻行業的月活用戶已達11.36億,增速明顯,視頻內容正成為流量的核心載體。
更關鍵的是,AI大幅降低了視頻制作的人力成本、時間成本與技術門檻。無論是實拍視頻中所涉及的導演、演員、場地、后期等復雜流程,還是動畫視頻所需的渲染、建模、特效等高技能工序,AI視頻都能在幾秒鐘內“一鍵生成”。
典型的例子,一部由迪士尼、皮克斯出品的頂級動畫電影,其每分鐘制作成本高達200萬美元,而AI模型生成的相似畫面,目前已可將單位成本壓縮至每分鐘300美元左右。
盡管現階段的視頻生成模型在效果穩定性、劇情連貫性上仍有明顯短板,通常只能輸出幾秒至幾分鐘的片段,但這卻恰好匹配了短視頻、短劇等輕內容場景的要求。
短視頻不僅在時長要求上需求更低,用戶注意力碎片化,也使得內容形式本身具備了更高容錯率。AI工具也就自然而然成為了短視頻剪輯師、MCN機構乃至普通創作者的增效神器。
為了快速占領創作者市場,不同于語言大模型從閉源走向開源的策略路徑,視頻生成廠商則選擇反其道而行之,從開源起步,給予用戶一定的免費使用權限,在拉新沉淀用戶習慣后,在通過訂閱制實現商業變現。
例如,快手可靈、字節即夢、騰訊混元均通過贈送積分、免費次數等方式引導C端訂閱。百度繪想則在2025年7月初推出時開放了免費試用;而通義萬相則以模型源碼的形式上傳至GitHub的方式進行開源分發。
背靠內容平臺的分發資源和用戶流量,字節、快手等內容大廠在國內C端用戶占據上更具優勢,已開始構建起“模型生成—內容創作—平臺分發”的閉環生態,將AI能力直接注入短視頻作者鏈條中,實現用戶對視頻模型的自然滲透。
相比之下,諸多創業公司如愛詩科技PixVerse、MiniMax海螺等,則將目標用戶對準了海外市場。
以愛詩科技為例,此前有公開數據表示,PixVerse總用戶已經達到了6000萬以上,月活用戶超1600萬,而這一數據公開時愛詩還尚未發布國內產品,并且單就用戶量來看,PixVerse已經成為了全球用戶量最大的AI視頻生成產品。
從模型性能來看,國內創業公司在多項榜單中表現優于海外競爭者。但在國內市場缺乏天然流量入口和品牌優勢的背景下,出海成為了他們繞過強平臺、尋找藍海的最優解。
除此之外,生數科技Vidu則選擇將目標放在了B端市場,于今年四月和飛書、百度搜索達成了合作。而在此之前,也分別與AR,VR等設備廠商、影視動漫網站等開展了合作。
03 模版還是工具?AI視頻生成走向分岔路
通過在社交軟件上的相關評論可以發現,同樣面向短視頻創作,快手和抖音呈現出了不同的內容優勢,可靈在國風、二次元方面占優勢,而即夢善于寫實、藝術領域的內容生成。
兩者之所以選擇出各自的垂類賽道,一定程度上迎合了各自平臺的內容特色。以真實生活記錄為內容導向的快手,在模版選擇上更加接地氣,而以娛樂化、潮流化為趨勢的抖音,則在風格化能力上更為突出。


來源:可靈官網
來源:即夢官網
但無論是可靈還是即夢,當AI視頻生成模型服務于短視頻創作時,模版特效和提示詞設計的效果和穩定性,成了AI視頻生成類教程里逃不開的關鍵詞。
換句話說,“選得快、改得少、出片穩”才是決定工具使用頻率的核心變量。
事實上,愛詩科技PixVerse之所以能夠在海外獲得如此高的用戶量,一定程度上也得益于其模板化的視頻生成思路,通過提供眾多5s左右的“模版特效”,簡化創作者的生成路徑,類似的功能,在海螺、可靈中也有相似。
模版特效的優勢在于能夠極大降低創作者的制作門檻,做出符合平均水平的視頻效果。但與此同時,它的副作用也同樣明顯:確實能跑量,但無法拉長生命周期。一旦用戶審美疲勞,內容熱度轉瞬即逝,ROI表現也難以持續。
而這恰恰是AI視頻在內容平臺中面臨的結構性困境——效率很高,但很難留下“經典”。
從這個角度來看,AI視頻依然要去探索長時間、高質量視頻的模型生成模式。
作為2018年就開始推出第一個視頻生成模型的老大哥,Runway走在了更前面,根據官方數據顯示,盡管過去一年,Runway的官網訪問量不足可靈的二分之一,但ARR卻幾乎達到了可靈的六倍。
Runway的商業邏輯,與短視頻模式走向了截然相反的路徑,通過與電影公司等高附加值產業合作,生產較為高品質的影視內容作品。
區別在于,Runway將視頻生成更多定位為“創意效率工具”,而非低門檻生產工具。它的核心功能主要有中間幀控制、AI角色的表情與動作復刻、視頻擴展等,在實現效率的同時,核心的創意輸出依然由人類自身所掌控。
當市面上開始涌現出越來越多的AI產品,留給行業和時代的問題,更需要從對AI效率轉化性能的評價,轉向厘清AI工具的使用邊界,讓真正的增量內容從中生長出來。
原文標題 : 視頻生成模型大盤點:誰能定義下一代內容?
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













