訂閱
糾錯(cuò)
加入自媒體

AI大模型未來將走向何方?廣泛應(yīng)用成首要挑戰(zhàn)

2021-11-22 16:39
來源: 粵訊

目前在AI行業(yè),大模型火到破圈。

今年11月初,華為云盤古大模型的機(jī)場廣告在首都機(jī)場和深圳寶安機(jī)場亮相,主打“行業(yè)AI開發(fā)應(yīng)用優(yōu)選”的定位。11月18日,權(quán)威時(shí)政媒體中國新聞周刊官方微博發(fā)布了華為云盤古大模型海報(bào),引發(fā)了廣泛關(guān)注。

AI大模型未來將走向何方?廣泛應(yīng)用成首要挑戰(zhàn)

以往,AI大模型這類基礎(chǔ)設(shè)施層面的前沿技術(shù)極少在大眾廣告渠道被看到。如今,大模型不僅成為眾多AI行業(yè)峰會(huì)中被高頻討論的熱詞,在AI行業(yè)之外的影響力也日漸擴(kuò)大。這些都表明,AI大模型正在加速走出實(shí)驗(yàn)室,成為賦能各行各業(yè)的通用AI基礎(chǔ)設(shè)施。

自2020年OpenAI推出NLP大模型GPT3至今,全球范圍內(nèi)AI大模型迎來大爆發(fā),參與企業(yè)越來越多,參數(shù)級(jí)別越來越大,成為新一輪AI競賽的賽場。目前,大模型吸引了谷歌、微軟、英偉達(dá)、華為、智源研究院、百度、阿里、商湯、浪潮、中科院自動(dòng)化所等科技巨頭和頂尖科研機(jī)構(gòu)參與其中,各家大模型的參數(shù)量級(jí)也從千億、萬億,迅速躍遷到了10萬億級(jí)別。

同時(shí)我們也看到,大模型火爆的背后卻面臨廣泛應(yīng)用的困局。技術(shù)很牛,落地很難,不夠接地氣,成為業(yè)界對大模型發(fā)展的普遍認(rèn)知。大模型百家爭鳴的格局背后,AI行業(yè)更需要冷思考。

AI大模型應(yīng)該為應(yīng)用而生

為什么眾多科技巨頭扎堆推出大模型?

這要回歸到AI落地的核心挑戰(zhàn)。國際歐亞科學(xué)院院士、華為云人工智能領(lǐng)域首席科學(xué)家、IEEE Fellow田奇認(rèn)為,AI進(jìn)入千行百業(yè)面臨很多挑戰(zhàn),其中最重要有三點(diǎn):第一,AI場景碎片化使得AI技術(shù)難以大規(guī)模復(fù)制。傳統(tǒng)的定制化、作坊式的模型開發(fā)方式是“一個(gè)場景一個(gè)模型”,無法復(fù)用和積累,導(dǎo)致AI開發(fā)的高門檻、高成本。第二,如何將行業(yè)知識(shí)與AI技術(shù)相結(jié)合,跨越行業(yè)know how與AI技術(shù)之間的鴻溝。第三,AI技術(shù)一直面臨攻擊、隱私、安全以及可解釋性方面的難題。

AI大模型擁有超大規(guī)模參數(shù)、巨量訓(xùn)練數(shù)據(jù),通過模型的巨量化可以提高人工智能的通用屬性,并降低人工智能的應(yīng)用門檻。正因?yàn)橹睋鬉I落地的挑戰(zhàn),大模型成為很多AI企業(yè)的共識(shí)。

那么,AI大模型能帶來科學(xué)計(jì)算的范式革命嗎?目前還存在哪些局限?10月底,華為云AI院長峰會(huì)匯聚了AI產(chǎn)學(xué)研各界的最強(qiáng)大腦,來自華為的AI科學(xué)家與來自中國科學(xué)院、中國工程院以及國內(nèi)30余所頂尖高校的數(shù)十名院長、教授關(guān)于AI大模型的現(xiàn)狀和前景進(jìn)行了專業(yè)的探討。各界大咖普遍認(rèn)為,目前AI大模型最大挑戰(zhàn)在應(yīng)用落地,如何讓更多行業(yè)和場景真正用起來。

首先,不是所有場景都需要大模型。大模型在醫(yī)藥研發(fā)、衛(wèi)星遙感、災(zāi)害評(píng)估、自然生態(tài)監(jiān)測等場景有巨大價(jià)值,但一些數(shù)據(jù)量小、任務(wù)并不復(fù)雜的場景,并不適合使用大模型,相當(dāng)于“大炮打蚊子”。

其次,大模型不是參數(shù)數(shù)量越大越好,如何廣泛應(yīng)用才是最大價(jià)值和難點(diǎn)。大模型應(yīng)用價(jià)值取決于其泛化能力,能否快速適配不同場景。

一位AI領(lǐng)域教授認(rèn)為:“大模型不在于大,而在于能不能解決應(yīng)用的問題,是不是來自于真正的需求。怎么樣能夠在更廣泛的應(yīng)用場景中用起來,這是目前大模型非常大的挑戰(zhàn)!

“大模型應(yīng)該是AI走向下一個(gè)時(shí)代的跳板。大模型的大一定是體現(xiàn)它能夠去掌握、組織更大量的數(shù)據(jù),而不是模型的參數(shù)量大!币晃蝗A為云高級(jí)研究員也持同樣的觀點(diǎn)。

第三,大模型不是萬能的,不應(yīng)該希望一個(gè)大模型能解決所有問題。

“如果大模型想要實(shí)際用的比較好,一定要有配套的工作流。如果把下游的工作流程給搭建起來,大模型在很多場景上能夠得到比較好的應(yīng)用!痹摳呒(jí)研究員表示。

深入AI落地的無人區(qū)

如果說參數(shù)的直觀對比類似外行看熱鬧,那么,落地能力才是大模型實(shí)力的真正較量。

目前,大模型在落地層面還處在探索的初期,各大科技巨頭都在摸索嘗試。其中華為云盤古大模型在行業(yè)應(yīng)用方面走得更遠(yuǎn),已經(jīng)在能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等行業(yè)的100多個(gè)場景實(shí)際應(yīng)用, 讓企業(yè)的AI應(yīng)用開發(fā)效率平均提升了90%。

今年4月華為云發(fā)布的盤古系列預(yù)訓(xùn)練大模型具有超大規(guī)模參數(shù)、超高精度的特質(zhì),還提供模型預(yù)訓(xùn)練、微調(diào)、部署和迭代的功能,以減少行業(yè)側(cè)的數(shù)據(jù)標(biāo)注依賴,從而降低人工智能開發(fā)的門檻和成本。

華為云盤古系列大模型包括NLP(中文語言)大模型、CV(視覺)大模型、多模態(tài)大模型和科學(xué)計(jì)算大模型。盤古大模型家族還在不斷壯大,今年9月華為云新推出盤古藥物分子大模型,其研究了17億個(gè)小分子的化學(xué)結(jié)構(gòu),可以高效生成藥物新分子,計(jì)算蛋白質(zhì)靶點(diǎn)匹配,預(yù)測新分子生化屬性,并對篩選后的先導(dǎo)藥進(jìn)行定向優(yōu)化,實(shí)現(xiàn)全流程的AI輔助藥物設(shè)計(jì)。

在眾多行業(yè)場景中,還存在著大量AI尚未落地的無人區(qū)。其中很多場景都有這樣的特征:樣本復(fù)雜多樣且不均衡,如果使用傳統(tǒng)AI模型標(biāo)注成本高、效率低、準(zhǔn)確率也有待提升。這些場景正是盤古AI大模型的典型應(yīng)用場景之一。盤古大模型把自己化作AI世界的開路先鋒,深入傳統(tǒng)AI模型難以觸及的領(lǐng)域,不斷探索AI落地的前沿。

在電力行業(yè),國網(wǎng)重慶永川公司在智能電力巡檢場景用無人機(jī)代替人工進(jìn)行缺陷檢測,但面臨海量數(shù)據(jù)標(biāo)注工作量大和缺陷種類繁多等問題。盤古 CV 大模型利用海量無標(biāo)注電力數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并結(jié)合少量標(biāo)注樣本微調(diào)的高效開發(fā)模式,提出了針對電力行業(yè)的預(yù)訓(xùn)練模型。應(yīng)用之后,樣本篩選效率提升約 30 倍,篩選質(zhì)量提升約 5 倍,以永川每天采集 5 萬張高清圖片為例,可節(jié)省人工標(biāo)注時(shí)間 170 人天。

同時(shí),結(jié)合華為云盤古大模型搭載的自動(dòng)數(shù)據(jù)增廣以及類別自適應(yīng)損失函數(shù)優(yōu)化策略,可以做到一個(gè)模型適配上百種缺陷,一個(gè)模型就可以替代永川原先的 20 多個(gè)小模型,極大地減少了模型維護(hù)成本,平均精度提升 18.4%,模型開發(fā)成本降低 90%。

在金融行業(yè),金融機(jī)構(gòu)擔(dān)保貸款通常要求企業(yè)提供不動(dòng)產(chǎn)擔(dān)保。原因在于動(dòng)產(chǎn)移動(dòng)性較強(qiáng),很難控制動(dòng)產(chǎn)的去向和價(jià)值,監(jiān)管難度大,銀行提供貸款風(fēng)險(xiǎn)較高。因此動(dòng)產(chǎn)很難作為抵押物進(jìn)行融資貸款,造成中小企業(yè)融資難的困境。

浦發(fā)銀行的浦惠云倉項(xiàng)目利用人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈、金融科技等相關(guān)技術(shù),能夠智能地監(jiān)測收貨、入庫、在庫、出庫等環(huán)節(jié),識(shí)別異常行為,確保貨物“不調(diào)包”和貨物數(shù)量準(zhǔn)確。該項(xiàng)目采用華為云盤古大模型,用一個(gè)模型覆蓋全部9種物流場景,通過對人員異常行為、入庫/出庫異常檢測、叉車軌跡異常識(shí)別等全部流程檢測,實(shí)現(xiàn)了對動(dòng)產(chǎn)的實(shí)時(shí)監(jiān)管,增強(qiáng)了銀行風(fēng)控能力。另外數(shù)字化也提高了動(dòng)產(chǎn)解質(zhì)押、出庫、進(jìn)入市場等環(huán)節(jié)的流通時(shí)間,將原來的為120天資金占用回款周期縮短到20-30天,大幅降低了企業(yè)的融資成本。

在生態(tài)監(jiān)測方面,華為云盤古科學(xué)計(jì)算大模型實(shí)現(xiàn)了對全球海浪浪高的實(shí)時(shí)預(yù)測,在精度和覆蓋范圍與傳統(tǒng)科學(xué)計(jì)算相當(dāng)?shù)幕A(chǔ)上,將預(yù)測速度提升到了原來的10,000倍。

在時(shí)尚產(chǎn)業(yè),華為云盤古多模態(tài)大模型強(qiáng)大的跨模態(tài)檢索、跨模態(tài)生成能力,不斷延伸AI的創(chuàng)造力。通過以文搜圖和以圖搜文能力,可以實(shí)現(xiàn)趨勢預(yù)測。通過以文生圖和以圖生圖能力,盤古多模態(tài)大模型可以通過文本控制來快速生成服裝圖片,供人類設(shè)計(jì)師參考。

優(yōu)秀的泛化能力是如何煉成的?

當(dāng)大模型普遍受困于落地難題,為什么盤古大模型率先做到了廣泛應(yīng)用?這離不開其開發(fā)過程中首次采用的眾多領(lǐng)先技術(shù)。

比如,盤古大模型首次在對比度自監(jiān)督學(xué)習(xí)中引入了樣本相似性,使得小樣本學(xué)習(xí)的能力獲得了顯著提升。盤古 CV 大模型是首個(gè)判別與生成聯(lián)合預(yù)訓(xùn)練的模型,其小樣本學(xué)習(xí)性能在 10% 的標(biāo)簽分類上精度達(dá)到了業(yè)界第一。盤古大模型首創(chuàng)采用“階段式訓(xùn)練”和“動(dòng)態(tài)冰化”策略,顯著提升大模型訓(xùn)練的穩(wěn)定性和效率;在下游應(yīng)用中,僅需少量樣本和學(xué)習(xí)參數(shù)即可完成千億規(guī)模大模型的快速微調(diào)和下游適配等等。

作為盤古大模型的“設(shè)計(jì)師”,田奇此前曾表示,盤古大模型設(shè)計(jì)之初秉持了三個(gè)核心原則:“第一,網(wǎng)絡(luò)規(guī)模要大;第二,模型大但不能臃腫,有強(qiáng)壯的網(wǎng)絡(luò)架構(gòu),希望它是百米冠軍,系統(tǒng)的性能要做到極致,綜合性能提升10%以上;第三,希望它有優(yōu)秀的泛化能力,也就是場景覆蓋率要高,不僅是單項(xiàng)的百米冠軍,也希望是10項(xiàng)全能冠軍!

之所以堅(jiān)持這樣的技術(shù)路線,源自盤古大模型的初衷:讓AI開發(fā)由作坊式向工業(yè)式轉(zhuǎn)變,降低行業(yè)AI開發(fā)應(yīng)用門檻,讓大模型真正走進(jìn)千行百業(yè),不再只是大資本和大實(shí)驗(yàn)室的專屬。在AI走向千行百業(yè)過程中,華為云盤古大模型在行業(yè)落地方面快人一步,能夠幫助行業(yè)專家快速掌握AI技能。

“華為云AI的目標(biāo)就是持續(xù)創(chuàng)新,打造人工智能黑土地,使能大規(guī)模、可復(fù)制的AI行業(yè)應(yīng)用!碧锲姹硎。

放眼全球AI產(chǎn)業(yè),大模型已經(jīng)成為國際間AI技術(shù)競爭的一個(gè)熱點(diǎn),通過大模型構(gòu)筑中國AI技術(shù)競爭壁壘,是這一代中國科技企業(yè)的機(jī)遇和挑戰(zhàn)。中國工程院院士、鵬城實(shí)驗(yàn)室主任、北京大學(xué)信息科學(xué)技術(shù)學(xué)院院長、教授高文院士曾經(jīng)指出,中國的人工智能產(chǎn)業(yè)有政策支持、數(shù)據(jù)資源、應(yīng)用場景、青年人才四個(gè)長板。其中,豐富的數(shù)據(jù)資源和應(yīng)用場景是我國AI產(chǎn)業(yè)非常突出的優(yōu)勢。

如何將散落在各行各業(yè)的數(shù)據(jù)生產(chǎn)要素價(jià)值發(fā)揮到極致,AI大模型大有可為。尤其是當(dāng)AI大模型與行業(yè)專家的知識(shí)相結(jié)合,必將開啟新一輪的AI應(yīng)用浪潮,爆發(fā)出巨大的價(jià)值。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請輸入評(píng)論內(nèi)容...

請輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)