訂閱
糾錯(cuò)
加入自媒體

說(shuō)不盡的“百!贝髴(zhàn)

今年以來(lái),我國(guó)大模型產(chǎn)業(yè)駛?cè)?ldquo;百模”大戰(zhàn)時(shí)代,賽道熱度空前,大戰(zhàn)愈演愈烈。在本月初舉行的2023全球數(shù)字經(jīng)濟(jì)大會(huì)人工智能高峰論壇上,北京市經(jīng)濟(jì)和信息化局黨組書記、局長(zhǎng)姜廣智表示,現(xiàn)在全國(guó)已有80余個(gè)大模型公開發(fā)布。

“百模”

“百模”實(shí)則大模型產(chǎn)業(yè)領(lǐng)域中各家企業(yè)發(fā)布的大模型,目前,大模型及其產(chǎn)品主要分為三類。第一類是通用大模型,如OpenAI的ChatGPT、百度的‘文心一言’、科大訊飛的‘星火’等都屬于通用大模型;第二類是行業(yè)大模型;第三類是基于通用大模型或行業(yè)大模型的應(yīng)用型服務(wù)。目前已經(jīng)發(fā)布的產(chǎn)品大多集中在第一類和第二類。

從全球已經(jīng)發(fā)布的大模型分布來(lái)看,中美兩國(guó)數(shù)量合計(jì)占全球總數(shù)的超 80%。有專家披露,據(jù)不完全統(tǒng)計(jì),目前中國(guó) 10 億參數(shù)規(guī)模以上的大模型已發(fā)布 79 個(gè)。那么,國(guó)內(nèi)又有哪些大模型?

華為:盤古大模型

7月7日-9日,盤古大模型3.0在華為開發(fā)者大會(huì)2023上正式發(fā)布,由 5+N+X 三層架構(gòu)組成。

L0 基礎(chǔ)大模型:包含五個(gè)基礎(chǔ)大模型:中文語(yǔ)言(NLP)大模型、視覺(jué)(CV)大模型、多模態(tài)大模型、科學(xué)計(jì)算大模型和圖網(wǎng)絡(luò)(Graph)大模型。

L1 行業(yè)大模型:涵蓋N 個(gè)行業(yè)大模型,已推出了盤古金融大模型、盤古礦山大模型、盤古氣象大模型、盤古電力大模型、盤古制造質(zhì)檢大模型、盤古藥物分子大模型等行業(yè)大模型。

L2 場(chǎng)景模型:為客戶提供更多細(xì)化場(chǎng)景,它更加專注于某個(gè)具體的應(yīng)用場(chǎng)景或特定業(yè)務(wù),為客戶提供開箱即用的模型服務(wù)。例如基于氣象大模型的短臨氣象預(yù)報(bào)、臺(tái)風(fēng)預(yù)測(cè)等場(chǎng)景模型;基于電力大模型的無(wú)人機(jī)電力巡檢、電力缺陷識(shí)別等場(chǎng)景模型;基于時(shí)尚大模型的時(shí)尚輔助設(shè)計(jì)、時(shí)尚版權(quán)保護(hù)等場(chǎng)景模型。

截至目前,盤古大模型已深入金融、制造、政務(wù)、電力、煤礦、醫(yī)療、鐵路等 10 多個(gè)行業(yè),支撐起 400 多個(gè) AI 業(yè)務(wù)場(chǎng)景的應(yīng)用落地。

百度:文心一言

2月7日,百度正式宣布推出文心一言(ERNIE Bot),文心一言是基于文心大模型技術(shù)推出的生成式對(duì)話產(chǎn)品,底層技術(shù)基礎(chǔ)是文心大模型,底層邏輯是通過(guò)百度智能云提供服務(wù),吸引企業(yè)和機(jī)構(gòu)客戶使用API和基礎(chǔ)設(shè)施,共同搭建AI模型、開發(fā)應(yīng)用,實(shí)現(xiàn)產(chǎn)業(yè)AI普惠。

文心大模型包括NLP大模型、CV大模型、跨模態(tài)大模型、生物計(jì)算大模型、行業(yè)大模型。目前,文心大模型已經(jīng)迭代至3.5版本,與3.0版本相比,訓(xùn)練速度提升了2倍,推理速度提升了17倍,模型效果累計(jì)提升超過(guò)50%。

據(jù)百度官方表示,文心一言大模型的訓(xùn)練數(shù)據(jù)包括了萬(wàn)億級(jí)網(wǎng)頁(yè)數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級(jí)的語(yǔ)音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜等。

騰訊:混元大模型

基于騰訊強(qiáng)大的底層算力和低成本的高速網(wǎng)絡(luò)基礎(chǔ)設(shè)施,2022 年底騰訊發(fā)布了低成本、可落地的NLP萬(wàn)億大模型——混元(HunYuan)AI 大模型。

混元AI大模型采用騰訊太極機(jī)器學(xué)習(xí)平臺(tái)自研的訓(xùn)練框架AngelPTM,相比業(yè)界主流的解決方案,太極AngelPTM單機(jī)可容納的模型可達(dá)55B,20個(gè)節(jié)點(diǎn)(A100-40Gx8)可容納萬(wàn)億規(guī)模模型,節(jié)省45%訓(xùn)練資源,并在此基礎(chǔ)上訓(xùn)練速度提升1倍。

在模型層,混元大模型完整覆蓋 NLP 大模型、 CV 大模型、多模態(tài)大模型、文生圖大模型及眾多行業(yè)、領(lǐng)域、任務(wù)模型。其中,HunYuan-NLP 1T 的模型能力在自然語(yǔ)言理解任務(wù)榜單 CLUE 中登頂。

在產(chǎn)業(yè)化方面,混元先后支持了包括微信、QQ、游戲、騰訊廣告、騰訊云等眾多產(chǎn)品和業(yè)務(wù),通過(guò) NLP、CV、跨模態(tài)等 AI 大模型,不僅為業(yè)務(wù)創(chuàng)造了增量?jī)r(jià)值而且降低了使用成本。特別是其在廣告內(nèi)容理解、行業(yè)特征挖掘、文案創(chuàng)意生成等方面的應(yīng)用,在為騰訊廣告帶來(lái)大幅 GMV 提升的同時(shí),也初步驗(yàn)證了大模型的商業(yè)化潛力。

阿里:通義千問(wèn)

2022年9月,在阿里巴巴達(dá)摩院主辦的世界人工智能大會(huì)“大規(guī)模預(yù)訓(xùn)練模型”主題論壇上,達(dá)摩院副院長(zhǎng)周靖人發(fā)布阿里巴巴“通義”大模型系列,并宣布相關(guān)核心模型向全球開發(fā)者開源開放。

通義大模型打造了業(yè)界首個(gè)AI(人工智能)統(tǒng)一底座,在業(yè)界首次實(shí)現(xiàn)模態(tài)表示、任務(wù)表示、模型結(jié)構(gòu)的統(tǒng)一。以統(tǒng)一底座為基礎(chǔ),達(dá)摩院構(gòu)建了層次化的模型體系,其中通用模型層覆蓋自然語(yǔ)言處理、多模態(tài)、計(jì)算機(jī)視覺(jué),專業(yè)模型層深入電商、醫(yī)療、法律、金融、娛樂(lè)等行業(yè)。

目前,通義大模型系列已在超過(guò)200個(gè)場(chǎng)景中提供服務(wù),實(shí)現(xiàn)了2%~10%的應(yīng)用效果提升。典型使用場(chǎng)景包括電商跨模態(tài)搜索、AI輔助設(shè)計(jì)、開放域人機(jī)對(duì)話、法律文書學(xué)習(xí)、醫(yī)療文本理解等。

京東:言犀大模型

7月13日,京東言犀大模型在2023京東全球科技探索者大會(huì)暨京東云峰會(huì)上推出。與通用大模型相比,靈犀大模型融合70%通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù),具有“更高產(chǎn)業(yè)屬性、更強(qiáng)泛化能力、更多安全保障”的優(yōu)勢(shì)。

同時(shí),京東還推出了一套大模型的完整工具,包括支撐大模型研發(fā)的基礎(chǔ)設(shè)施——言犀AI開發(fā)計(jì)算平臺(tái)、向量數(shù)據(jù)庫(kù)、混合多云操作系統(tǒng)云艦、高性能存儲(chǔ)平臺(tái)云海、軟硬一體虛擬化引擎京剛等核心產(chǎn)品。

該模型的落地應(yīng)用路線圖“125”計(jì)劃也已公布,包括一個(gè)平臺(tái)、兩個(gè)領(lǐng)域和五個(gè)應(yīng)用。其中,一個(gè)平臺(tái)為ChatJD智能人機(jī)對(duì)話平臺(tái),兩個(gè)領(lǐng)域?yàn)榱闶酆徒鹑,五個(gè)應(yīng)用則包括內(nèi)容生成、人機(jī)對(duì)話、用戶意圖理解、信息抽取和情感分類。

360:360智腦大模型

6月13日,360集團(tuán)正式召開“360智腦大模型”應(yīng)用發(fā)布會(huì),發(fā)布認(rèn)知型通用大模型“360智腦4.0”,并宣布360智腦已經(jīng)接入360旗下產(chǎn)品“全家桶”中。

據(jù)介紹,本次發(fā)布的“智腦大模型”已經(jīng)具備四大核心能力,包括文字處理能力、圖像處理能力、語(yǔ)音處理能力以及視頻處理能力,可實(shí)現(xiàn)文生文、文生圖、文生表、圖生圖、圖生文、視頻理解等功能。

360選擇了大而全路線,對(duì)標(biāo)微軟的全家桶。當(dāng)前,360智腦已具備生成與創(chuàng)作、多輪對(duì)話、代碼能力、文本分類、文本改寫、閱讀理解、邏輯與推理、知識(shí)問(wèn)答、多模態(tài)、翻譯等十大核心能力,維度涵蓋數(shù)百項(xiàng)細(xì)分功能。

科大訊飛:星火認(rèn)知大模型

5月6日,科大訊飛星火認(rèn)知大模型正式發(fā)布,涵蓋了文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理等七項(xiàng)核心能力,并持續(xù)迭代于6月9日再次升級(jí)發(fā)布星火認(rèn)知大模型V1.5。

目前,科大訊飛圍繞星火認(rèn)知大模型,以一平臺(tái) + 多賽道的“1+N”模式,將業(yè)務(wù)范圍延展到包括開放平臺(tái)、智慧教育、智慧醫(yī)療、智慧城市、運(yùn)營(yíng)商在內(nèi)的多個(gè)領(lǐng)域。其中,“1”是指以通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺(tái),“N”則是針對(duì)于多個(gè)行業(yè)領(lǐng)域的專用大模型版本,其中,包含教育、醫(yī)療、汽車、人機(jī)交互、辦公、翻譯、工業(yè)等。

所有產(chǎn)品都值得用大模型重做一遍

“所有產(chǎn)品都值得用大模型重做一遍。”在2023年阿里云峰會(huì)上,阿里巴巴集團(tuán)董事會(huì)主席兼CEO張勇說(shuō)道。

放到應(yīng)用層面來(lái)理解,玩家都期待借著這個(gè)風(fēng)口,把自家產(chǎn)品包裝一下再重新推廣出去。所以,目前各家的大模型都與本身業(yè)務(wù)類型相關(guān)。這也就說(shuō)明,目前國(guó)內(nèi)的“百模”大戰(zhàn),大模型的內(nèi)卷仍是互聯(lián)網(wǎng)企業(yè)主流業(yè)務(wù)的競(jìng)爭(zhēng)。

小結(jié):

大模型產(chǎn)業(yè)是未來(lái)科技競(jìng)爭(zhēng)的關(guān)鍵較量之一。有些專家認(rèn)為,聚焦細(xì)分領(lǐng)域有可能讓成本降低,讓大模型在領(lǐng)域落地和成本優(yōu)化方面進(jìn)展更快才能真正普惠更多用戶。

有些專家對(duì)此持相反觀點(diǎn),認(rèn)為:細(xì)分行業(yè)只存在于“中模型”,不存在于”大模型“,只有覆蓋多個(gè)行業(yè)、通用才叫大模型,畢竟“百模大戰(zhàn)”最終拼的是場(chǎng)景落地能力。

如何率先突圍,仍然需要時(shí)間的檢驗(yàn)。

       原文標(biāo)題 : 資本 | 說(shuō)不盡的“百!贝髴(zhàn)

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)