對標Sora!國產視頻大模型Vidu發布
今年初,文生視頻大模型Sora的亮相引發行業高度關注,也在資本市場上掀起浪潮。時隔兩個月,清華團隊打造了一個中國版的Sora——視頻大模型Vidu近日正式發布。近期爭。
01
清華團隊參與打造
Vidu性能強勁
4月27日,在中關村論壇未來人工智能先鋒論壇上,中國首個長時長、高一致性、高動態性視頻大模型Vidu正式發布。據悉,Vidu視頻大模型是由清華大學與生數科技聯合發布的中國首個長時長、高一致性、高動態性視頻大模型。這一模型的發布,標志著中國在視頻大模型技術領域取得了顯著的進展,能夠與國際上的先進模型如Sora相媲美。
據介紹,Vidu模型采用了團隊原創的Diffusion與Transformer融合的架構U-ViT,支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內容。
性能方面,Vidu不僅能夠模擬真實物理世界,生成細節復雜且符合真實物理規律的場景,如合理的光影效果和細膩的人物表情,還擁有豐富的想象力,能夠創造出具有深度和復雜性的超現實主義內容。
此外,Vidu能夠生成復雜的動態鏡頭,實現遠景、近景、中景、特寫等不同鏡頭的切換,不再局限于簡單的固定鏡頭。特別值得一提的是,Vidu能夠理解并生成熊貓、龍等特有的中國元素,展現了對中國傳統文化的深刻理解。
同時,Vidu的生成方式是“一步到位”的,文本到視頻的轉換直接且連續,基于單一模型完全端到端生成,不涉及中間的插幀和其他多步驟的處理,這在技術上是一個重要的創新。
02
背后公司生數科技受關注
Vidu背后依托的是一家名為生數科技的創業公司,該公司核心成員主要來自清華大學人工智能學院,致力于自主研發世界領先的可控多模態通用大模型。生數科技的CEO唐家渝、首席科學家朱軍以及CTO鮑凡,都是在人工智能和擴散模型領域有著深厚研究的專家。
生數科技自成立以來,就備受資本市場的關注,已經完成了三輪融資,融資額達到數億元人民幣。投資方包括啟明創投、智譜AI、BV百度風投、錦秋基金等知名投資機構。公司的快速發展和Vidu模型的成功研發,展示了生數科技在多模態大模型領域的深厚積累和創新能力。
在人工智能領域,生數科技采取的是模型層和應用層并行推進的模式,一方面構建底層通用大模型,提供模型服務能力;另一方面,打造針對圖像生成、視頻生成等場景的垂直應用,服務于游戲制作、影視后期等內容創作場景。
03
大模型將成未來發展重要一環
大模型技術作為人工智能領域的一個重要分支,其未來的發展前景十分廣闊,無疑將成為未來發展的重要一環。隨著技術的不斷進步,其應用場景將進一步拓展,從視頻和圖像生成,到游戲制作、影視后期等內容創作,大模型技術將為各行各業帶來革命性的變化,在多個領域發揮更加重要的作用。
首先,大模型技術通過其強大的數據處理和學習能力,正成為推動人工智能技術創新的關鍵因素。它們能夠處理和學習海量數據,從而在圖像識別、自然語言處理、機器翻譯等多個領域實現前所未有的準確性和效率。
其次,大模型正成為多行業應用的推動者。大模型的跨領域應用潛力巨大,可以被應用于醫療健康、金融服務、教育培訓、自動駕駛、智能制造等眾多行業。通過提供深度分析和預測,大模型能夠幫助這些行業提高決策質量,優化服務流程,降低成本,并創造新的商業模式。
此外,大模型技術在提高生產效率、降低運營成本、創造新的就業機會等方面的潛力,將對經濟結構產生深遠影響,可能會成為推動經濟轉型和產業升級的關鍵驅動力。
- End -
原文標題 : 對標Sora!國產視頻大模型Vidu發布
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













