訂閱
糾錯
加入自媒體

AIGC,喊出了元宇宙的“芝麻開門”

來源 | 伯虎財經(jīng)(bohuFN)

作者 | 陳平安

2022年8月,在美國科羅拉多州博覽會上,一幅名為《太空歌劇院》的繪畫作品贏得了數(shù)字類別的一等獎,但不少人對于這個獎項的授予并不服氣。

爭議并不源自作品的質(zhì)量,而是這幅作品并不完全由畫師個人完成。游戲設(shè)計師Jason Allen首先是通過AI繪圖工具M(jìn)idjourney生成原畫,再經(jīng)過Photoshop潤色,從而完成了這幅作品。

這并非AIGC(人工智能內(nèi)容生成)發(fā)展的孤例。就在月前,互聯(lián)網(wǎng)刮起了一陣ChatGPT風(fēng),起因是OpenAI發(fā)布了一個全新的聊天機(jī)器人模型—— ChatGPT。和過去那些聊天機(jī)器人相比,ChatGPT不僅可以回答人類的追問,承認(rèn)自己回答中的錯誤,拒絕回答不適當(dāng)?shù)膯栴},還能寫詩和編程。根據(jù)外媒報道,有人甚至讓ChatGPT為自己寫論文并獲得了及格。

連馬斯克都忍不住感嘆:“ChatGPT好得嚇人,我們離強大到危險的人工智能不遠(yuǎn)了。"

當(dāng)藝術(shù)界開始因為“AI繪畫到底算不算藝術(shù)品”而吵得不可開交,當(dāng)普羅大眾對ChatGPT的對話能力驚嘆不已,AIGC本身值得期待的就不再只是驚人的迭代和學(xué)習(xí)能力,而是作為一個生產(chǎn)力和生產(chǎn)工具的結(jié)合體,在生成內(nèi)容維度和智能化程度上所展現(xiàn)的潛力。

破解元宇宙內(nèi)容難題

一個公認(rèn)的事實是,制約元宇宙相關(guān)產(chǎn)業(yè)發(fā)展的重要瓶頸,是內(nèi)容生產(chǎn)上的不足。也許你會馬上反駁,最大的障礙難道不是技術(shù)的不成熟嗎?確實,當(dāng)下無論是VR還是AR,交互技術(shù)和光學(xué)技術(shù)都無法達(dá)到大多數(shù)人對元宇宙期望的那樣。

但元宇宙相關(guān)產(chǎn)業(yè)的落地和發(fā)展并不完全依賴于這些硬件,無論是數(shù)字人還是元宇宙第一股Roblox都足以證明。

元宇宙當(dāng)前最大的挑戰(zhàn)反而是在內(nèi)容側(cè),如何提供能夠滿足各行各業(yè)需求的高質(zhì)量內(nèi)容?

以數(shù)字人為例,"擬人化"和"自動化"是判斷一個數(shù)字人等級的標(biāo)準(zhǔn)。在這個標(biāo)準(zhǔn)下,數(shù)字人被分為了L1-L5五個等級。其中L4級別的數(shù)字人能夠?qū)崿F(xiàn)部分智能化交互;L5級則能夠?qū)崿F(xiàn)完全智能化交互。從L4級別開始,數(shù)字人能夠逐漸替代真人去完成服務(wù)。

(來源:商湯智能產(chǎn)業(yè)研究院)

這也意味著,數(shù)字人產(chǎn)業(yè)的突破,和L4及以上級別的數(shù)字人能否量產(chǎn)息息相關(guān)。但一般一個數(shù)字人的生成需要經(jīng)過模型重建、動畫準(zhǔn)備等多個過程,制作流程長達(dá)數(shù)月,這種生產(chǎn)力上的不足也嚴(yán)重制約了數(shù)字人的普及。

AIGC正在成為打破這道瓶頸的關(guān)鍵。

從2016年創(chuàng)造SenseMARS平臺時,AI龍頭商湯科技就開始從全景智能的角度布局AIGC各種能力。

到目前為止,商湯不僅在計算機(jī)視覺方面積累了超過49000個算法模型,覆蓋從視覺信號的分析理解到實現(xiàn)數(shù)字內(nèi)容的生成等各方面;也自研并具備了包括語音識別(ASR)、語義理解(NLP知識圖譜)、語音合成(TTS)以及語音動畫合成(STA)等多項技術(shù)能力。

通過這些底層AI技術(shù)的迭代,商湯幾乎重塑了數(shù)字人的整個生產(chǎn)流程。

(來源:商湯智能產(chǎn)業(yè)研究院)

在傳統(tǒng) CG 建模環(huán)節(jié)里,商湯推出的智能化生成引擎可以基于少量照片的面部掃描,算法自動生成高精度的3D 面部模型,大大減少了建模環(huán)節(jié)的投入和時間成本。

智能化驅(qū)動引擎則通過STA等算法加速協(xié)調(diào)數(shù)字人的擬人化程度,讓其整體動作表現(xiàn)更加自然,減輕了畫師的工作強度和人工成本。

而在決定數(shù)字人"自動化"的多模態(tài)交互和深度學(xué)習(xí)能力構(gòu)建環(huán)節(jié),智能化交互引擎專注于提高數(shù)字人的智慧性。基于語音識別(ASR)、語音合成(TTS)、自然語言理解(NLP)等技術(shù)組合,結(jié)合商湯所積累的海量特定知識領(lǐng)域的知識問答庫,數(shù)字人不僅可以和用戶快速高效的建立對話關(guān)系,還能實現(xiàn)自身的深度學(xué)習(xí)和迭代升級。

同樣的例子在游戲產(chǎn)業(yè)也有所體現(xiàn)。

游戲是業(yè)內(nèi)公認(rèn)的元宇宙雛形之一,但當(dāng)下游戲產(chǎn)業(yè)發(fā)展的桎梏也很明顯,即內(nèi)容創(chuàng)新。傳統(tǒng)開發(fā)存在明顯的智能上限,這使得游戲很難持續(xù)為玩家提供情緒價值。在此條件下,游戲廠商們要么持續(xù)投入大量資金做內(nèi)容建設(shè),要么等待下一個天才策劃或者玩法的出現(xiàn)。

也因此,能夠快速、高質(zhì)量產(chǎn)出內(nèi)容的AIGC被視為了破局的關(guān)鍵。2021年商湯成立了智慧決策與游戲事業(yè)部,推出了SenseMAP。這款集合了商湯深度學(xué)習(xí)、智慧決策等前沿的AI技術(shù)的產(chǎn)品幾乎涵蓋了游戲開發(fā)的整個流程。

在游戲生態(tài)上,SenseMAP不僅能夠通過真實玩家游戲數(shù)據(jù)訓(xùn)練NPC,讓其具備類似真實玩家的游戲行為,還能讓其和普通玩家進(jìn)行互動。

在內(nèi)容生態(tài)上,SenseMAP支持角色設(shè)計、動作捕捉、人臉3D生成等多項功能,大大降低了角色的生產(chǎn)周期,滿足玩家的UGC需求。

隨著AIGC的發(fā)展和普及,過去那些耗費巨大的知識性和創(chuàng)造性工作的邊際成本將大幅降低,過去制約元宇宙相關(guān)產(chǎn)業(yè)發(fā)展的內(nèi)容問題將迎刃而解,從而產(chǎn)生巨大的生產(chǎn)效率和經(jīng)濟(jì)價值。

可以預(yù)見的是,AIGC正站在元宇宙的石門前,喊出了那聲“芝麻開門”。

AIGC何以被點燃?

AIGC的本質(zhì)是內(nèi)容與場景,需要AI與后端基建,也就是算法、數(shù)據(jù)和算力共同生成。當(dāng)下,AIGC正朝著更強、更快、更低成本的方向發(fā)展。

一方面,隨著AI模型的通用性不斷提高,AIGC應(yīng)用的門檻在降低,效率卻在進(jìn)一步提高。

2015年以前,小模型被公認(rèn)為是AI模型的最優(yōu)選。這是因為小型的模型對于硬件的要求較低,同時和大模型相比,小模型具有更高的可解釋性和穩(wěn)健性。但小模型的缺點在于,對通用任務(wù)的處理表現(xiàn)并不好。換言之,他們很難針對特定領(lǐng)域或者場景去進(jìn)行定制。

在這個背景下,大模型脫穎而出。大模型可泛化能力強,可以做到"舉一反三",同一模型利用少量數(shù)據(jù)進(jìn)行微調(diào)或不進(jìn)行微調(diào)就能完成多個場景的任務(wù),從而擺脫小模型應(yīng)用碎片化、作坊式開發(fā)的特點。

這為AIGC進(jìn)入新階段提供了契機(jī)。以商湯為例,剖析其技術(shù)基座,商湯元宇宙主要基于SenseMARS火星混合現(xiàn)實平臺打造,目前該平臺內(nèi)含3,500個人工智能模型,包括感知智能、決策智能、智能內(nèi)容生成(包括增強現(xiàn)實、混合現(xiàn)實)、軟件智能體及其他基礎(chǔ)設(shè)施(如云引擎等)。

基于SenseMARS,商湯能夠針對不同的行業(yè)拿出的方案,從而實現(xiàn)元宇宙相關(guān)產(chǎn)業(yè)的廣泛應(yīng)用。前文提到的數(shù)字人就是典型案例。商湯打造的AI數(shù)字人不僅在逼真程度上媲美真人,而且更聰明,能夠"聽得懂,看得見,說得出",很重要的原因在于商湯的AI數(shù)字人是由三種引擎(算法)共同打造的。

另一方面,算力、算法模型等后端基建相關(guān)的基礎(chǔ)設(shè)施建設(shè)加速了大模型的生產(chǎn)迭代,這為AIGC的廣泛應(yīng)用打下了基礎(chǔ)。

爆火的ChatGPT能夠?qū)崿F(xiàn)當(dāng)前的交互,就離不開OpenAI在AI預(yù)訓(xùn)練大模型領(lǐng)域的積累。從2018年起,OpenAI就開始發(fā)布生成式預(yù)訓(xùn)練語言模型GPT,可用于生成文章、代碼、機(jī)器翻譯、問答等各類內(nèi)容。

在這股預(yù)訓(xùn)練大模型的風(fēng)潮之下,是一場拼參數(shù)、拼算力的軍備競賽。2018年,GPT的參數(shù)量還只有1.17億。隨后幾年,OpenAI每一代GPT模型的參數(shù)量都爆炸式增長。到2020年5月,新發(fā)布的GPT-3參數(shù)量直接暴漲至1750億。

AI模型對算力的需求在過去短短幾年內(nèi)翻了大約100萬倍,平均每年十幾倍,這個增速甚至超過了對算法精度增長的需求。

算力即最核心的生產(chǎn)力。如何把握住驅(qū)動AIGC的根本源動力?商湯的人工智能基礎(chǔ)設(shè)施SenseCore AI大裝置在更早時候已給出了答案。

資料顯示,SenseCore商湯AI大裝置的核心由計算基礎(chǔ)設(shè)施、模型層、深度學(xué)習(xí)層三個部分架構(gòu)而成,分別對應(yīng)算力、算法模型生成和算法模型訓(xùn)練三個要素。

2022年,商湯在上海臨港的智算中心AIDC正式運營,是亞洲最大的人工智能智能計算中心之一。得益于磅礴算力的加持,模型層中的商湯的SenseSpring“模型工廠”能夠快速生成穩(wěn)定可靠的模型,截至2022年6月,累計生產(chǎn)近50000個商用人工智能模型。

ChatGPT本質(zhì)上是基于NLP大模型落地的應(yīng)用。而基于SenseCore,在視覺大模型領(lǐng)域,商湯已訓(xùn)練和構(gòu)建了超過300億量級模型參數(shù)超大基模型,得以有效支持AIGC的應(yīng)用。

商湯2022年中報透露,公司在ImageNet大規(guī)模識別任務(wù)中實現(xiàn)超90%精度,和Google、微軟共同躋身世界前三。

在SenseCore的助力下,算法模型在快速生成和迭代的同時,成本也在降低。

據(jù)商湯中報披露,基于大模型的自動數(shù)據(jù)生產(chǎn)線不僅將數(shù)據(jù)自動標(biāo)注速度提升到了傳統(tǒng)人工的600倍,成本也降到了過去人工的1/500,且標(biāo)注精度與人工水平一致。

通過SenseCore商湯AI大裝置強大的算力基礎(chǔ)和領(lǐng)先的算法能力,商湯能夠以高效、自動化、集約化的方式,讓高質(zhì)量的AI算法實現(xiàn)“量產(chǎn)”,從而進(jìn)一步拓展AIGC的應(yīng)用范圍。

毋庸置疑,屬于元宇宙的黃金時代已經(jīng)初見端倪。

元宇宙未來已來

盡管《頭號玩家》那樣的元宇宙看起來離我們還很遙遠(yuǎn),但是元宇宙和我們生活的聯(lián)系遠(yuǎn)比我們想象的要緊密。

在廣州悅匯城周年慶的現(xiàn)場,越秀地產(chǎn)聯(lián)合商湯推出AR Show,游客們可以看到冰龍在上空盤旋,夢幻逼真的冰雪城堡,還有從天而降的紅包雨等。

這無疑為顧客提供了一種全新的互動方式,也重新定義了"商業(yè)空間"的概念。在悅匯城周年慶活動期間,AR Show助力廣州悅匯城全場銷售額同比增長196%,客流增長超過開業(yè)同期。

一些我們熟悉的服務(wù)場景也在元宇宙的加持下發(fā)生了變化。寧波銀行上海分行就有一位特殊的大堂客服經(jīng)理——商湯科技基于"AI數(shù)字人服務(wù)中臺"為寧波銀行專屬打造的數(shù)字人員工小寧。

據(jù)了解,小寧不僅可以對前來辦理業(yè)務(wù)的顧客給予主動問候和自動接待,并通過專業(yè)、自然的交流互動,提供各類業(yè)務(wù)咨詢和問題回復(fù),還能針對客戶需求進(jìn)行自動化引導(dǎo)和智能分流。

日前,小寧“首次亮相直播平臺,這也是商湯科技AI數(shù)字人”虛擬IP在線上營銷場景中的首次應(yīng)用。

事實上,元宇宙相關(guān)產(chǎn)業(yè)的商業(yè)化路徑正逐漸清晰,早早布局的商湯憑借先發(fā)優(yōu)勢顯露頭角。

在線上元宇宙方面,商湯已實現(xiàn)軟件向SaaS模式的升級,連續(xù)6年實現(xiàn)市場份額增長,市場份額蟬聯(lián)第一。

商湯生產(chǎn)的交互式AI數(shù)字人,在文旅、展館、金融、教育、商超等實體產(chǎn)業(yè)中廣泛應(yīng)用。與此同時,商湯在2022年與敦煌文創(chuàng)、徐悲鴻美術(shù)館等合作生成頂級IP數(shù)字文創(chuàng)產(chǎn)品,并發(fā)行超2萬個限量版數(shù)字藏品。

商湯同步深度布局線下元宇宙場景,以簽約運營的商業(yè)模式,落地了百余個海內(nèi)外元宇宙項目,累計生成超過一千萬平米線下場景。

僅商業(yè)零售元宇宙領(lǐng)域,商湯與中國電信合作賦能400多家商業(yè)綜合體。在北京富力廣場、上海虹口凱德mall、武漢萬象城、鄭州正弘城,商湯的商業(yè)空間元宇宙應(yīng)用正在為線下商業(yè)帶來新的突破點和增長點。

更直觀的表現(xiàn)則是,商湯2022年中報顯示,包含元宇宙業(yè)務(wù)的智慧生活板塊上半年營收同比增長98%,占總收入的21%。

Gartner預(yù)測稱,到2026年,全球30%的企業(yè)機(jī)構(gòu)將擁有用于數(shù)字人和元宇宙的產(chǎn)品與服務(wù)。未來AIGC存在規(guī)模化變現(xiàn)的潛力。麥肯錫則預(yù)測,到2030年全球元宇宙相關(guān)支出或達(dá)5萬億美元。

在這場或許比移動互聯(lián)網(wǎng)更加顛覆的大變革里,靠著布局和技術(shù)的領(lǐng)先身位,商湯有望迎來新的增長曲線。

*文章封面首圖及配圖,版權(quán)歸版權(quán)所有人所有。若版權(quán)者認(rèn)為其作品不宜供大家瀏覽或不應(yīng)無償使用,請及時聯(lián)系我們,本平臺將立即更正。

       原文標(biāo)題 : AIGC,喊出了元宇宙的“芝麻開門”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號