訂閱
糾錯
加入自媒體

2024年大模型行業(yè)研究報告

第一章 行業(yè)概況

1.1 簡介

大模型是指具有大規(guī)模參數(shù)和復(fù)雜計算結(jié)構(gòu)的機器學(xué)習(xí)模型。這些模型通常由深度神經(jīng)網(wǎng)絡(luò)構(gòu)建而成,擁有數(shù)十億甚至數(shù)千億個參數(shù)。大模型的設(shè)計目的是為了提高模型的表達能力和預(yù)測性能,能夠處理更加復(fù)雜的任務(wù)和數(shù)據(jù)。大模型在各種領(lǐng)域都有廣泛的應(yīng)用,包括自然語言處理、計算機視覺、語音識別和推薦系統(tǒng)等。大模型通過訓(xùn)練海量數(shù)據(jù)來學(xué)習(xí)復(fù)雜的模式和特征,具有更強大的泛化能力,可以對未見過的數(shù)據(jù)做出準確的預(yù)測。

圖 大模型產(chǎn)業(yè)圖譜

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

1.2 分類

按輸入數(shù)據(jù)類型的不同:語言大模型(NLP),視覺大模型(CV)和多模態(tài)大模型。NLP通常用來處理文本數(shù)據(jù)和理解自然語言,例如GPT系列,文心一言等。CV通常用于圖像處理和分析,例如VIT系列,文心UFO等。多模態(tài)大模型能夠處理多種不同類型數(shù)據(jù),例如DingoDB多模向量數(shù)據(jù)庫等。

按應(yīng)用領(lǐng)域的不同:三個層次,通用大模型L0,行業(yè)大模型L1和垂直大模型L2。通用大模型L0是指可以在多個領(lǐng)域和任務(wù)上通用的大模型。行業(yè)大模型L1是指針對特定行業(yè)或領(lǐng)域的大模型。垂直大模型L2是指針對特定任務(wù)或場景的大模型。

大模型市場容量及規(guī)模巨大,預(yù)計2028年將達到1179億元。

圖 我國大模型產(chǎn)業(yè)市場規(guī)模

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

第二章 產(chǎn)業(yè)鏈、商業(yè)模式及政策監(jiān)管2.1 產(chǎn)業(yè)鏈

大模型指參數(shù)規(guī)模較大的預(yù)訓(xùn)練模型。這些模型通常具有數(shù)十億甚至數(shù)千億個參數(shù),需要在大量硬件資源上進行訓(xùn)練。大模型通過對數(shù)據(jù)進行分布式表示,能夠捕捉到數(shù)據(jù)中的復(fù)雜關(guān)系,提高模型在各類任務(wù)中的泛化能力。

從大模型行業(yè)產(chǎn)業(yè)鏈來看,上游主要包括硬件和軟件,硬件又包括芯片、服務(wù)器、通信網(wǎng)絡(luò)等;軟件又包括云計算、數(shù)據(jù)庫、中間件等。中游是指大模型行業(yè);下游是指大模型的應(yīng)用領(lǐng)域,包括游戲、辦公、傳媒影視、醫(yī)療、金融、電商、工業(yè)等,這些領(lǐng)域的多樣化需求將推動大模型不斷進行技術(shù)創(chuàng)新和優(yōu)化,提升模型的準確性和效率。

圖 大模型產(chǎn)業(yè)鏈

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

通用大模型

如GPT、BERT等,能夠處理多種類型的任務(wù),如文本生成、文本分類、機器翻譯等。

圖 國內(nèi)通用大模型布局

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

多模態(tài)大模型

能夠處理多種模態(tài)的數(shù)據(jù),如圖像、文本、語音等,如CLIP、DALL-E等。

圖 2022-2023年主流多模態(tài)大模型

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

AI大模型

指具有巨大參數(shù)規(guī)模的人工智能模型。這些模型通過機器學(xué)習(xí)和深度學(xué)習(xí)的技術(shù)來學(xué)習(xí)和理解龐大的數(shù)據(jù)量。AI大模型的發(fā)展推動了人工智能領(lǐng)域的快速發(fā)展,并在各個領(lǐng)域中展現(xiàn)出驚人的應(yīng)用潛力。

圖 AI大模型譜系圖

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

金融和投資大模型

2024年4月10日,在2024數(shù)字產(chǎn)業(yè)鏈金融行業(yè)峰會上,網(wǎng)商銀行宣布旗下的供應(yīng)鏈金融解決方案大雁系統(tǒng)升級,AI大模型首次應(yīng)用于產(chǎn)業(yè)鏈金融場景,提升小微企業(yè)金融服務(wù)的覆蓋率和便捷性。

在該領(lǐng)域上,大模型系統(tǒng)幫助金融和投資機構(gòu)構(gòu)建更全面的企業(yè)圖譜。同時,大模型有語義理解、生成能力,與大模型驅(qū)動的Agent實時反饋能力疊加,能夠更好地刻畫小微企業(yè)的經(jīng)營狀況和信用情況。

圖 金融大模型的價值與作用

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2.2 商業(yè)模式

目前大模型商業(yè)應(yīng)用尚處早期,以 API、PaaS、MaaS 三種模式為主。當(dāng)前全球大模型產(chǎn)業(yè)落地仍處于 早期探索階段,需要與下游場景企業(yè)合作建立大模型商業(yè)模式,但下游企業(yè)目前對于大模型的理解相對 有限,所需要的資源支撐比較薄弱?偟膩碚f,大模型落地可以通過 API 接口調(diào)用付費、或者大廠提供 落地所需的開發(fā)工具、云平臺、服務(wù)等的 PaaS 模式,更進一步是直接提供相關(guān)定制好的模型調(diào)用的 MaaS 模式。

應(yīng)用程序編程接口(Application Programming Interface,簡稱:API),是一些預(yù)先定義的函數(shù),目的是提供應(yīng)用程序與開發(fā)人員基于某軟件或硬件得以訪問一組例程的能力,而又無需訪問源碼,或理解內(nèi)部工作機制的細節(jié)。

近年來軟件的規(guī)模日益龐大,常常需要把復(fù)雜的系統(tǒng)劃分成小的組成部分,編程接口的設(shè)計十分重要。程序設(shè)計的實踐中,編程接口的設(shè)計首先要使軟件系統(tǒng)的職責(zé)得到合理劃分。良好的接口設(shè)計可以降低系統(tǒng)各部分的相互依賴,提高組成單元的內(nèi)聚性,降低組成單元間的耦合程度,從而提高系統(tǒng)的維護性和擴展性。

圖 通用大模型的主要商業(yè)模式

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

PaaS模式(Platform as a Service)是指平臺即服務(wù)。把服務(wù)器平臺作為一種服務(wù)提供的商業(yè)模式,通過網(wǎng)絡(luò)進行程序提供的服務(wù)稱之為SaaS(Software as a Service),是云計算三種服務(wù)模式之一,而云計算時代相應(yīng)的服務(wù)器平臺或者開發(fā)環(huán)境作為服務(wù)進行提供就成為了PaaS。

所謂PaaS實際上是指將軟件研發(fā)的平臺作為一種服務(wù),以SaaS的模式提交給用戶。因此,PaaS也是SaaS模式的一種應(yīng)用。但是,PaaS的出現(xiàn)可以加快SaaS的發(fā)展,尤其是加快SaaS應(yīng)用的開發(fā)速度。在2007年國內(nèi)外SaaS廠商先后推出自己的PAAS平臺。

圖 未來PaaS市場增長驅(qū)動力強勁

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

SaaS軟件運營服務(wù)是(Software as a Service,簡稱SaaS)讓用戶能夠通過互聯(lián)網(wǎng)連接來使用基于云的應(yīng)用程序。常見示例有電子郵件、日歷和辦公工具。它不需要用戶將軟件產(chǎn)品安裝在自己的電腦或服務(wù)器上。

SaaS提供完整的軟件解決方案,用戶可以從云服務(wù)提供商處以即用即付方式進行購買。為組織租用應(yīng)用,組織用戶即可通過互聯(lián)網(wǎng)連接到該應(yīng)用(通常使用 Web瀏覽器)。所有基礎(chǔ)結(jié)構(gòu)、中間件、應(yīng)用軟件和應(yīng)用數(shù)據(jù)都位于服務(wù)提供商的數(shù)據(jù)中心內(nèi)。服務(wù)提供商負責(zé)管理硬件和軟件,并根據(jù)適當(dāng)?shù)姆⻊?wù)協(xié)議確保應(yīng)用和數(shù)據(jù)的可用性和安全性。SaaS讓組織能夠通過最低前期成本的應(yīng)用快速建成投產(chǎn)。

圖 2021 年全球公有云 SaaS 市場份額

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

大模型產(chǎn)業(yè)市場規(guī)模持續(xù)增長,市場前景廣闊。預(yù)計2028年市場規(guī)模將達到1179億元。2022~2028年復(fù)合增長率約為60.11%,市場規(guī)模快速成長。

圖 我國大模型產(chǎn)業(yè)市場規(guī)模

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2.3 技術(shù)發(fā)展

大模型的起源可以追溯到20世紀90年代,當(dāng)時人工智能領(lǐng)域還處于初創(chuàng)期,研究人員主要關(guān)注的是基于規(guī)則的專家和知識表示系統(tǒng)。數(shù)據(jù)資源的不斷增加和計算機性能的不斷提升,人們開始意識到基于數(shù)據(jù)驅(qū)動的機器學(xué)習(xí)方法在人工智能領(lǐng)域具有更大的潛力。大模型的概念逐漸浮出水面。

近十余年間,人工智能技術(shù)泛化能力、創(chuàng)新能力及應(yīng)用效能不斷提升,成為了推動經(jīng)濟及社會發(fā)展的重要引擎。

2015年前后,人臉識別算法達到接近人眼的識別能力,被視為人工智能技術(shù)工業(yè)級應(yīng)用水平的代表性事件。

2022年,以ChatGPT為代表的大模型為用戶帶來了全新交互體驗。通過其在內(nèi)容生成、文本轉(zhuǎn)化和邏輯推理等任務(wù)下的高效、易操作表現(xiàn),大模型正逐步成為當(dāng)前主流應(yīng)用程序的重要組成部分。

圖 大模型技術(shù)發(fā)展各時期

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2023年7月,OpenAI向用戶正式開放了代碼解析插件Code Interpreter,使得ChatGPT和GPT-4可以根據(jù)用戶問題來編寫和執(zhí)行代碼,從而拓展了模型在數(shù)據(jù)分析、復(fù)雜計算與功能調(diào)用方面的能力。

圖 全球大模型技術(shù)發(fā)展脈絡(luò)

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2023年,大語言模型及其在人工智能領(lǐng)域的應(yīng)用已成為全球科技研究的熱點,其在規(guī)模上的增長尤為引人注目,參數(shù)量已從最初的十幾億躍升到如今的一萬億。參數(shù)量的提升使得模型能夠更加精細地捕捉人類語言微妙之處,更加深入地理解人類語言的復(fù)雜性。在過去的一年里,大語言模型在吸納新知識、分解復(fù)雜任務(wù)以及圖文對齊等多方面都有顯著提升。隨著技術(shù)的不斷成熟,它將不斷拓展其應(yīng)用范圍,為人類提供更加智能化和個性化的服務(wù),進一步改善人們的生活和生產(chǎn)方式。

圖 大模型帶來語音技術(shù)發(fā)展的全新機會

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2023年被視為中國大模型的發(fā)展元年。3月16日,百度正式推出了基于百度新一代大語言模型的生成式AI產(chǎn)品“文心一言”,成為了率先“跑出來”的國內(nèi)大模型廠商。文心一言的問世,也拉開了國內(nèi)“百模大戰(zhàn)”的帷幕。此后,阿里、華為、騰訊、京東、科大訊飛、360、字節(jié)跳動等科技公司紛紛發(fā)布了自家的大模型。文心一言發(fā)布8個月后的11月15日,李彥宏在深圳西麗湖論壇上表示,國內(nèi)目前已經(jīng)發(fā)布了238個大模型。這意味著,在這兩百多天里,平均每天都有一個大模型問世。

圖 國內(nèi)大模型技術(shù)路線圖

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2.4 政策監(jiān)管

大模型在快速發(fā)展的同時也帶來了一系列潛在的風(fēng)險和挑戰(zhàn)。

一方面,大模型所需的海量數(shù)據(jù)、復(fù)雜參數(shù)以及工程難度放大了人工智能固有的技術(shù)風(fēng)險,如數(shù)據(jù)竊取、泄露等安全問題,模型黑盒導(dǎo)致決策結(jié)果難預(yù)測和難解釋問題,以及模型面對隨機擾動和惡意攻擊的魯棒性問題。

另一方面,大模型的多場景通用性也放大了隱私風(fēng)險、歧視風(fēng)險和濫用風(fēng)險等應(yīng)用風(fēng)險。這些問題引發(fā)了全球范圍的關(guān)注,對人工智能治理能力與治理水平提出了新的挑戰(zhàn)。

目前,全球大模型治理正處于探索階段,從人工智能倫理準則等基本共識出發(fā),逐步深入推動大模型監(jiān)管政策法規(guī)和企業(yè)治理落地實踐。國際組織積極制定人工智能治理原則及倡議,重點關(guān)注大模型的治理和監(jiān)管問題。

圖 2023年以來國內(nèi)大模型相關(guān)政策梳理

來源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

在政策方面,2021年11月,聯(lián)合國教科文組織通過了《人工智能倫理問題建議書》,旨在促使人工智能系統(tǒng)造福人類、社會、環(huán)境和生態(tài)系統(tǒng)、防止危害,同時促進和平利用人工智能系統(tǒng)。

2023年11月,在英國人工智能安全峰會期間,包括中國、美國、英國等 28 個國家和歐盟共同簽署了《布萊切利宣言》,確保人工智能以人為本、值得信賴并負責(zé)任,通過國際倫理和其他相關(guān)倡議促進合作,應(yīng)用人工智能帶來的廣泛風(fēng)險。

同年11月,世界互聯(lián)網(wǎng)大會發(fā)布了《發(fā)展負責(zé)任的生成式人工智能研究報告及共識文件》,就發(fā)展負責(zé)任的生成式人工智能提出十條共識。

在標準方面,ISO/IEC JTC1 /SC42人工智能分委會正在開展人工智能可信賴國際標準研制工作,為指導(dǎo)利益相關(guān)方研發(fā)、使用可信賴人工智能相關(guān)技術(shù)和系統(tǒng)提供參考,主要標準包括 ISO/IEC TR 24028:2020《人工智能的可信賴概述》、ISO/IEC 38507:2022《組織使用人工智能的治理影響》等。

全球主要經(jīng)濟體加快推進大模型治理和監(jiān)管相關(guān)政策制定步伐。中國在人工智能監(jiān)管方面主張“包容審慎的分類分級監(jiān)管”原則,國家網(wǎng)信辦已于2023年7月10日頒布了首部面向大模型監(jiān)管的《生成式人工智能服務(wù)管理暫行辦法》,后續(xù)將進一步針對生成式人工智能技術(shù)特點及其在有關(guān)行業(yè)和領(lǐng)域的服務(wù)應(yīng)用,制定相應(yīng)的分類分級監(jiān)管規(guī)則或指引。

2023年10月8日,中國科技部發(fā)布《科技倫理審查辦法(試行)》,提出從事人工智能科技活動的單位,研究內(nèi)容涉及科技倫理敏感領(lǐng)域的,應(yīng)設(shè)立科技倫理(審查)委員會,并建立倫理高風(fēng)險科技活動的清單制度,對可能產(chǎn)生較大倫理風(fēng)險挑戰(zhàn)的新興科技活動實施清單管理。

2023年10月18日,國家網(wǎng)信辦發(fā)布《全球人工智能治理倡議》,提出發(fā)展人工智能應(yīng)堅持相互尊重、平等互利的原則,各國無論大小、強弱,無論社會制度如何,都有平等發(fā)展和利用人工智能的權(quán)利。

在標準方面,中國信息通信研究院已經(jīng)啟動《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法》系列標準研制的工作,全面覆蓋大模型的開發(fā)、部署和應(yīng)用環(huán)節(jié),其中第四部分可信要求是目前國內(nèi)首項針對大模型領(lǐng)域的可信賴標準。

與此同時,全國信息安全標準化技術(shù)委員會已經(jīng)啟動包括《信息安全技術(shù) 生成式人工智能服務(wù)安全基本要求》在內(nèi)的三項生成式人工智能安全國家標準編制工作,以支撐大模型的監(jiān)管落地。

歐盟現(xiàn)行人工智能立法仍主要集中在傳統(tǒng)人工智能,但已經(jīng)開始關(guān)注通用人工智能以及生成式人工智能的問題,主張尊重人格尊嚴、個人自由和保護數(shù)據(jù)及隱私安全。

2023年6月14日,歐洲議會投票通過《人工智能法案》,該法案基于風(fēng)險等級將人工智能系統(tǒng)分成四類,并制定了不同程度的監(jiān)管要求。

2023年5月13日,美國白宮總統(tǒng)科技顧問委員會(PCAST)成立生成式人工智能工作組,以幫助評估關(guān)鍵機遇和風(fēng)險,并就如何更好地確保這些技術(shù)的開發(fā)和部署盡可能公平、負責(zé)任和安全提供意見。

2023年10月30日,美國總統(tǒng)拜登簽署人工智能行政令,旨在加強對人工智能潛在風(fēng)險的監(jiān)管,發(fā)展安全、可靠和值得信賴的人工智能,促進人工智能創(chuàng)新,確保美國在人工智能領(lǐng)域繼續(xù)領(lǐng)跑全球。

同時行政令在標準方面,提出美國國家標準與技術(shù)研究所(NIST)將制定嚴格的人工智能安全測試標準,人工智能系統(tǒng)在公開發(fā)布前需根據(jù)這些標準進行廣泛的測試以確保安全。

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號