2024年大模型行業研究報告

第一章 行業概況
1.1 簡介
大模型是指具有大規模參數和復雜計算結構的機器學習模型。這些模型通常由深度神經網絡構建而成,擁有數十億甚至數千億個參數。大模型的設計目的是為了提高模型的表達能力和預測性能,能夠處理更加復雜的任務和數據。大模型在各種領域都有廣泛的應用,包括自然語言處理、計算機視覺、語音識別和推薦系統等。大模型通過訓練海量數據來學習復雜的模式和特征,具有更強大的泛化能力,可以對未見過的數據做出準確的預測。
圖 大模型產業圖譜

來源:資產信息網 千際投行 iFinD
1.2 分類
按輸入數據類型的不同:語言大模型(NLP),視覺大模型(CV)和多模態大模型。NLP通常用來處理文本數據和理解自然語言,例如GPT系列,文心一言等。CV通常用于圖像處理和分析,例如VIT系列,文心UFO等。多模態大模型能夠處理多種不同類型數據,例如DingoDB多模向量數據庫等。
按應用領域的不同:三個層次,通用大模型L0,行業大模型L1和垂直大模型L2。通用大模型L0是指可以在多個領域和任務上通用的大模型。行業大模型L1是指針對特定行業或領域的大模型。垂直大模型L2是指針對特定任務或場景的大模型。
大模型市場容量及規模巨大,預計2028年將達到1179億元。
圖 我國大模型產業市場規模

來源:資產信息網 千際投行 iFinD
第二章 產業鏈、商業模式及政策監管2.1 產業鏈
大模型指參數規模較大的預訓練模型。這些模型通常具有數十億甚至數千億個參數,需要在大量硬件資源上進行訓練。大模型通過對數據進行分布式表示,能夠捕捉到數據中的復雜關系,提高模型在各類任務中的泛化能力。
從大模型行業產業鏈來看,上游主要包括硬件和軟件,硬件又包括芯片、服務器、通信網絡等;軟件又包括云計算、數據庫、中間件等。中游是指大模型行業;下游是指大模型的應用領域,包括游戲、辦公、傳媒影視、醫療、金融、電商、工業等,這些領域的多樣化需求將推動大模型不斷進行技術創新和優化,提升模型的準確性和效率。
圖 大模型產業鏈

來源:資產信息網 千際投行 iFinD
通用大模型
如GPT、BERT等,能夠處理多種類型的任務,如文本生成、文本分類、機器翻譯等。
圖 國內通用大模型布局

來源:資產信息網 千際投行 iFinD
多模態大模型
能夠處理多種模態的數據,如圖像、文本、語音等,如CLIP、DALL-E等。
圖 2022-2023年主流多模態大模型

來源:資產信息網 千際投行 iFinD
AI大模型
指具有巨大參數規模的人工智能模型。這些模型通過機器學習和深度學習的技術來學習和理解龐大的數據量。AI大模型的發展推動了人工智能領域的快速發展,并在各個領域中展現出驚人的應用潛力。
圖 AI大模型譜系圖

來源:資產信息網 千際投行 iFinD
金融和投資大模型
2024年4月10日,在2024數字產業鏈金融行業峰會上,網商銀行宣布旗下的供應鏈金融解決方案大雁系統升級,AI大模型首次應用于產業鏈金融場景,提升小微企業金融服務的覆蓋率和便捷性。
在該領域上,大模型系統幫助金融和投資機構構建更全面的企業圖譜。同時,大模型有語義理解、生成能力,與大模型驅動的Agent實時反饋能力疊加,能夠更好地刻畫小微企業的經營狀況和信用情況。
圖 金融大模型的價值與作用

來源:資產信息網 千際投行 iFinD
2.2 商業模式
目前大模型商業應用尚處早期,以 API、PaaS、MaaS 三種模式為主。當前全球大模型產業落地仍處于 早期探索階段,需要與下游場景企業合作建立大模型商業模式,但下游企業目前對于大模型的理解相對 有限,所需要的資源支撐比較薄弱。總的來說,大模型落地可以通過 API 接口調用付費、或者大廠提供 落地所需的開發工具、云平臺、服務等的 PaaS 模式,更進一步是直接提供相關定制好的模型調用的 MaaS 模式。
應用程序編程接口(Application Programming Interface,簡稱:API),是一些預先定義的函數,目的是提供應用程序與開發人員基于某軟件或硬件得以訪問一組例程的能力,而又無需訪問源碼,或理解內部工作機制的細節。
近年來軟件的規模日益龐大,常常需要把復雜的系統劃分成小的組成部分,編程接口的設計十分重要。程序設計的實踐中,編程接口的設計首先要使軟件系統的職責得到合理劃分。良好的接口設計可以降低系統各部分的相互依賴,提高組成單元的內聚性,降低組成單元間的耦合程度,從而提高系統的維護性和擴展性。
圖 通用大模型的主要商業模式

來源:資產信息網 千際投行 iFinD
PaaS模式(Platform as a Service)是指平臺即服務。把服務器平臺作為一種服務提供的商業模式,通過網絡進行程序提供的服務稱之為SaaS(Software as a Service),是云計算三種服務模式之一,而云計算時代相應的服務器平臺或者開發環境作為服務進行提供就成為了PaaS。
所謂PaaS實際上是指將軟件研發的平臺作為一種服務,以SaaS的模式提交給用戶。因此,PaaS也是SaaS模式的一種應用。但是,PaaS的出現可以加快SaaS的發展,尤其是加快SaaS應用的開發速度。在2007年國內外SaaS廠商先后推出自己的PAAS平臺。
圖 未來PaaS市場增長驅動力強勁

來源:資產信息網 千際投行 iFinD
SaaS軟件運營服務是(Software as a Service,簡稱SaaS)讓用戶能夠通過互聯網連接來使用基于云的應用程序。常見示例有電子郵件、日歷和辦公工具。它不需要用戶將軟件產品安裝在自己的電腦或服務器上。
SaaS提供完整的軟件解決方案,用戶可以從云服務提供商處以即用即付方式進行購買。為組織租用應用,組織用戶即可通過互聯網連接到該應用(通常使用 Web瀏覽器)。所有基礎結構、中間件、應用軟件和應用數據都位于服務提供商的數據中心內。服務提供商負責管理硬件和軟件,并根據適當的服務協議確保應用和數據的可用性和安全性。SaaS讓組織能夠通過最低前期成本的應用快速建成投產。
圖 2021 年全球公有云 SaaS 市場份額

來源:資產信息網 千際投行 iFinD
大模型產業市場規模持續增長,市場前景廣闊。預計2028年市場規模將達到1179億元。2022~2028年復合增長率約為60.11%,市場規模快速成長。
圖 我國大模型產業市場規模

來源:資產信息網 千際投行 iFinD
2.3 技術發展
大模型的起源可以追溯到20世紀90年代,當時人工智能領域還處于初創期,研究人員主要關注的是基于規則的專家和知識表示系統。數據資源的不斷增加和計算機性能的不斷提升,人們開始意識到基于數據驅動的機器學習方法在人工智能領域具有更大的潛力。大模型的概念逐漸浮出水面。
近十余年間,人工智能技術泛化能力、創新能力及應用效能不斷提升,成為了推動經濟及社會發展的重要引擎。
2015年前后,人臉識別算法達到接近人眼的識別能力,被視為人工智能技術工業級應用水平的代表性事件。
2022年,以ChatGPT為代表的大模型為用戶帶來了全新交互體驗。通過其在內容生成、文本轉化和邏輯推理等任務下的高效、易操作表現,大模型正逐步成為當前主流應用程序的重要組成部分。
圖 大模型技術發展各時期

來源:資產信息網 千際投行 iFinD
2023年7月,OpenAI向用戶正式開放了代碼解析插件Code Interpreter,使得ChatGPT和GPT-4可以根據用戶問題來編寫和執行代碼,從而拓展了模型在數據分析、復雜計算與功能調用方面的能力。
圖 全球大模型技術發展脈絡

來源:資產信息網 千際投行 iFinD
2023年,大語言模型及其在人工智能領域的應用已成為全球科技研究的熱點,其在規模上的增長尤為引人注目,參數量已從最初的十幾億躍升到如今的一萬億。參數量的提升使得模型能夠更加精細地捕捉人類語言微妙之處,更加深入地理解人類語言的復雜性。在過去的一年里,大語言模型在吸納新知識、分解復雜任務以及圖文對齊等多方面都有顯著提升。隨著技術的不斷成熟,它將不斷拓展其應用范圍,為人類提供更加智能化和個性化的服務,進一步改善人們的生活和生產方式。
圖 大模型帶來語音技術發展的全新機會

來源:資產信息網 千際投行 iFinD
2023年被視為中國大模型的發展元年。3月16日,百度正式推出了基于百度新一代大語言模型的生成式AI產品“文心一言”,成為了率先“跑出來”的國內大模型廠商。文心一言的問世,也拉開了國內“百模大戰”的帷幕。此后,阿里、華為、騰訊、京東、科大訊飛、360、字節跳動等科技公司紛紛發布了自家的大模型。文心一言發布8個月后的11月15日,李彥宏在深圳西麗湖論壇上表示,國內目前已經發布了238個大模型。這意味著,在這兩百多天里,平均每天都有一個大模型問世。
圖 國內大模型技術路線圖

來源:資產信息網 千際投行 iFinD
2.4 政策監管
大模型在快速發展的同時也帶來了一系列潛在的風險和挑戰。
一方面,大模型所需的海量數據、復雜參數以及工程難度放大了人工智能固有的技術風險,如數據竊取、泄露等安全問題,模型黑盒導致決策結果難預測和難解釋問題,以及模型面對隨機擾動和惡意攻擊的魯棒性問題。
另一方面,大模型的多場景通用性也放大了隱私風險、歧視風險和濫用風險等應用風險。這些問題引發了全球范圍的關注,對人工智能治理能力與治理水平提出了新的挑戰。
目前,全球大模型治理正處于探索階段,從人工智能倫理準則等基本共識出發,逐步深入推動大模型監管政策法規和企業治理落地實踐。國際組織積極制定人工智能治理原則及倡議,重點關注大模型的治理和監管問題。
圖 2023年以來國內大模型相關政策梳理

來源:資產信息網 千際投行 iFinD
在政策方面,2021年11月,聯合國教科文組織通過了《人工智能倫理問題建議書》,旨在促使人工智能系統造福人類、社會、環境和生態系統、防止危害,同時促進和平利用人工智能系統。
2023年11月,在英國人工智能安全峰會期間,包括中國、美國、英國等 28 個國家和歐盟共同簽署了《布萊切利宣言》,確保人工智能以人為本、值得信賴并負責任,通過國際倫理和其他相關倡議促進合作,應用人工智能帶來的廣泛風險。
同年11月,世界互聯網大會發布了《發展負責任的生成式人工智能研究報告及共識文件》,就發展負責任的生成式人工智能提出十條共識。
在標準方面,ISO/IEC JTC1 /SC42人工智能分委會正在開展人工智能可信賴國際標準研制工作,為指導利益相關方研發、使用可信賴人工智能相關技術和系統提供參考,主要標準包括 ISO/IEC TR 24028:2020《人工智能的可信賴概述》、ISO/IEC 38507:2022《組織使用人工智能的治理影響》等。
全球主要經濟體加快推進大模型治理和監管相關政策制定步伐。中國在人工智能監管方面主張“包容審慎的分類分級監管”原則,國家網信辦已于2023年7月10日頒布了首部面向大模型監管的《生成式人工智能服務管理暫行辦法》,后續將進一步針對生成式人工智能技術特點及其在有關行業和領域的服務應用,制定相應的分類分級監管規則或指引。
2023年10月8日,中國科技部發布《科技倫理審查辦法(試行)》,提出從事人工智能科技活動的單位,研究內容涉及科技倫理敏感領域的,應設立科技倫理(審查)委員會,并建立倫理高風險科技活動的清單制度,對可能產生較大倫理風險挑戰的新興科技活動實施清單管理。
2023年10月18日,國家網信辦發布《全球人工智能治理倡議》,提出發展人工智能應堅持相互尊重、平等互利的原則,各國無論大小、強弱,無論社會制度如何,都有平等發展和利用人工智能的權利。
在標準方面,中國信息通信研究院已經啟動《大規模預訓練模型技術和應用評估方法》系列標準研制的工作,全面覆蓋大模型的開發、部署和應用環節,其中第四部分可信要求是目前國內首項針對大模型領域的可信賴標準。
與此同時,全國信息安全標準化技術委員會已經啟動包括《信息安全技術 生成式人工智能服務安全基本要求》在內的三項生成式人工智能安全國家標準編制工作,以支撐大模型的監管落地。
歐盟現行人工智能立法仍主要集中在傳統人工智能,但已經開始關注通用人工智能以及生成式人工智能的問題,主張尊重人格尊嚴、個人自由和保護數據及隱私安全。
2023年6月14日,歐洲議會投票通過《人工智能法案》,該法案基于風險等級將人工智能系統分成四類,并制定了不同程度的監管要求。
2023年5月13日,美國白宮總統科技顧問委員會(PCAST)成立生成式人工智能工作組,以幫助評估關鍵機遇和風險,并就如何更好地確保這些技術的開發和部署盡可能公平、負責任和安全提供意見。
2023年10月30日,美國總統拜登簽署人工智能行政令,旨在加強對人工智能潛在風險的監管,發展安全、可靠和值得信賴的人工智能,促進人工智能創新,確保美國在人工智能領域繼續領跑全球。
同時行政令在標準方面,提出美國國家標準與技術研究所(NIST)將制定嚴格的人工智能安全測試標準,人工智能系統在公開發布前需根據這些標準進行廣泛的測試以確保安全。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













