訂閱
糾錯
加入自媒體

ChatGPT之外,美國大模型搞到什么程度了?

2023-12-27 11:05
華商韜略
關注

通過行業(yè)應用先行來帶動整體的突破。

文 | 華商韜略 王夢欣

年初以來,OpenAI以ChatGPT在全球掀起AI大模型熱潮。但美國的AI大模型,遠不止于OpenAI的ChatGPT。

【井噴式發(fā)展】

綜合各種數(shù)據(jù),雖然中國發(fā)展勢頭迅猛,但美國依然是全球發(fā)布大模型最多的國家,到2023年5月,其10億級參數(shù)規(guī)模以上的基礎大模型就已突破100 個。

《經(jīng)濟學人》報道,美國2022年大模型投資總額達474億美元,是第二名中國(134億美元)的約3.5倍,且仍保持激增態(tài)勢。高盛則進一步預測,美國2025年大模型相關投資可達千億美元,約全球的1/2。

高盛的調查顯示,羅素3000指數(shù)公司中有16%的公司在2023年的財報會議中提到了大模型,其經(jīng)濟學家估計,大模型將在十年內提高1%的整體勞動生產率,并為標普500指數(shù)帶來約14%的增長。

除了ChatGPT,美國如今具有代表性的通用大模型公司還包括:Anthropic、Cohere以及Google等。

其中,由OpenAI前高管Dario和Daniela Amodei等人于2021年自立門戶創(chuàng)辦的Anthropic,目前估值已達300億美元,是僅次于OpenAI(約860億美元估值)的通用大模型企業(yè)。

Anthropic擁有多位參與過GPT-2與GPT-3研發(fā)的前OpenAI核心員工,其大模型產品Claude2也被認為是僅次于ChatGPT-4的經(jīng)典力作,甚至有分析師認為,Claude2的性能優(yōu)于ChatGPT-4。

比如,Claude2可以處理多達約75000個單詞的數(shù)據(jù)集,而ChatGPT大約是3000個,這意味著它可以處理和輸出更復雜的內容,也被應用到更有挑戰(zhàn)性的領域,比如生成數(shù)千字的長文內容。

更讓Claude2積攢人氣的是,它直接免費向公眾開放,而不是像GPT-4一樣需要付費使用。

優(yōu)秀的創(chuàng)始團隊和強大的產品性能,讓Anthropic備受資本追捧,谷歌、韓國最大移動運營商之一SK Telecom(SKT)、亞馬遜都已成為其投資者,其中僅亞馬遜的投資就高達40億美元。

在Anthropic之外,還有一家令人稱道的公司便是Cohere。

今年6月,2019年創(chuàng)立的Cohere獲得NVIDIA、Oracle、Salesforce Ventures等投資的2.7億美元,成為估值20億美元的獨角獸,也是估值僅次于OpenAI和Anthropic的基礎大模型公司。

Cohere同樣以強大創(chuàng)始團隊備受業(yè)內矚目,其創(chuàng)始人之一Aidan Gomez是大語言模型領域開創(chuàng)性論文《Attention is All You Need》的最年輕作者,正是這篇文章首次提出了著名的Transformer架構,成為通用大模型發(fā)展的基礎模型,ChatGPT就是在這一架構的基礎上誕生。

▲Cohere推出的第一個生成式AI應用Coral

Cohere與OpenAI提供的產品類似,但它看到了“數(shù)據(jù)隱私”這個市場機會,將自己與OpenAI的定位區(qū)分開來,選擇了ToB賽道,堅定地走商用大模型的路線。其產品基礎能力包括三大類:文本檢索,文本生成和文本分類,并且可針對客戶需求,強調安全性,隱私以及定制化服務。

Cohere的另一大賣點是,不受任何云端平臺限制,進而保障資料的私密安全性。它提供靈活性存儲和資料隱私保護路徑,可使用戶實現(xiàn)本地部署,以滿足客戶資料存儲不同位置的需求。

Cohere能迅速轉向,找到自己的差異化定位,離不開Aidan及其聯(lián)合創(chuàng)始人獨特的人才觀和創(chuàng)業(yè)哲學。

Aidan曾表示,Cohere尋找不同背景但對AI非常感興趣并富有雄心的人:他不一定有大公司的漂亮履歷,但是一定要對自己專注的領域有非常高的興趣和熱情,而且不光會寫論文,還要有實際動手的能力。

差異化的產品戰(zhàn)略,與眾不同的團隊背景,讓Cohere成為通用大模型領域的一股清流。

日前,Cohere發(fā)布了全球首個公開可用的多語言理解模型,該模型基于來自母語人士的真實數(shù)據(jù)進行訓練,能夠閱讀和理解全球超過100種最常用的語言。

再來看巨頭Google 。

12月6日,Google DeepMind重磅推出了多模態(tài)AI模型Gemini,可以同時橫跨文字、圖片、影音、程式碼等多模態(tài)進行學習與理解。

以客服機器人的應用為例,使用Gemini作為模型不僅能夠從對話的字面意思上理解客戶,更能同時從表情、聲調接收到客戶話語中的意圖,能處理包括音訊、程式碼、圖像、視訊等內容。

據(jù)實測結果,Gemini是第一個在大模型多任務語言理解上超越人類專家的模型,且在32項AI測試中,有30項測驗結果超過GPT-4。

憑借強大的性能,Gemini迅速出圈,并且為其母公司Alphabet創(chuàng)造巨大聲量。12月7日,Google 母公司Alphabet股價漲幅5.31%,收于136.93美元,總市值達到1.72萬億美元。Google 則計劃逐步將這一模型融合進其搜索、廣告等其他服務中。

但談到美國大模型,更值得重視的還是其在產業(yè)中的應用進展以及未來想象。

【加速產業(yè)落地】

斯坦福大學發(fā)布的《2023年人工智能索引報告》中顯示,2022年,美國的35個大模型中,只有3個大模型來自于實驗室,32個都誕生于產業(yè)中。今年,也仍然保持著這一趨勢。

2023年3月30日,當外界還沉浸在通用大模型涌現(xiàn)的狂歡中,彭博社憑一己之力將眾人的注意力集中到行業(yè)新賽道。當天,它對外宣稱,自己已構建出迄今為止最大的金融領域數(shù)據(jù)集,訓練了專門用于金融領域大語言模型的LLM,并開發(fā)了擁有500億參數(shù)的語言模型——BloombergGPT。

頂著全球首個金融大模型的光環(huán),BloombergGPT依托彭博社大量的金融數(shù)據(jù)源,構建了一個3630億個標簽的數(shù)據(jù)集。高金智庫分析,它可極大提高金融機構的工作效率及穩(wěn)定性,協(xié)助降本增效。

在降本層面,BloombergGPT可以在投研、研發(fā)編程、風險控制及流程管理等方面減少人員投入;增效層面,它既可以通過給定的主題和語境,自動生成高質量的金融報告、財務分析報告及招股書,同時輔助會計和審計方面的工作,還可提煉梳理財經(jīng)新聞或者財務信息,釋放專業(yè)人力到更需要人工專業(yè)的領域。

天風證券則在報告中指出,由于BloombergGPT比ChatGPT擁有更專業(yè)的訓練語料,它將在金融場景中表現(xiàn)出強于通用大模型的能力,進而也標志著金融領域的GPT革命已經(jīng)開始。

BloombergGPT只是一個典型案例,目前,美國金融大模型已呈現(xiàn)出明顯的三個“流派”:一是獨立全棧自研,強調自主可控;二是在他人的基礎上結合自身數(shù)據(jù)與場景微調,形成契合自身的金融大模型;三是從云端調用,按需接入各類大模型API做私有化部署,科技基礎薄弱的中小型金融公司多采用這類方式。

據(jù)有關統(tǒng)計數(shù)據(jù),美國金融AI約占整體AI領域融資的6.7%。

醫(yī)療行業(yè),是美國大模型落地應用的另一片熱土,谷歌、微軟等科技巨頭, Sensely、Enlitic等醫(yī)療科技公司,AbSci、Exscientia等生物醫(yī)藥初創(chuàng)企業(yè),以及賽紐仕等CXO(醫(yī)藥外包)企業(yè),都已參與其中。

化合物合成、靶點發(fā)現(xiàn)等新藥研發(fā)業(yè)務,電子病歷、輔助問診等醫(yī)院診療業(yè)務,則是美國醫(yī)療大模型應用的常用場景,CT(電腦斷層掃描)、MRI(磁共振成像)等醫(yī)療器械在大模型賦能下進一步增強。

眾多醫(yī)療大模型中,谷歌的Med-PaLM2是被關注的重點。它是第一個在美國醫(yī)師執(zhí)照考試(USMLE)的MEDQA數(shù)據(jù)集上達到“專家”考生水平的大模型,其準確率達85分以上;也是第一個在包括印度AIIMS和NEET醫(yī)學考試問題的MEDMCQA數(shù)據(jù)集上達到及格分數(shù)的人工智能系統(tǒng),得分為72.3分。

Med-PaLM2也正對行業(yè)帶來變革性影響。

通過Med-PaLM2,可以分析大規(guī)模的生物醫(yī)藥數(shù)據(jù),發(fā)現(xiàn)與疾病相關的基因、蛋白質和代謝途徑,識別潛在的靶點,幫助篩選具有潛在活性的藥物分子,從而縮小候選藥物的范圍,并優(yōu)先選擇具有較高活性的化合物進行后續(xù)實驗驗證。備受時間煎熬的新藥研發(fā),則將因此縮短研發(fā)周期,降低研發(fā)成本。

Med-PaLM2的成功,還刺激谷歌在醫(yī)療大模型領域投入更多。

如:與醫(yī)療軟件公司Epic合作,開發(fā)了一種基于ChatGPT的,可向患者自動發(fā)送專業(yè)醫(yī)療信息的工具;谷歌的合作方、護理供應商Carbon Health也基于GPT-4推出了一種AI工具Carby,它可以根據(jù)醫(yī)生病人之間的對話,自動生成診斷記錄,大大提高醫(yī)生的效率和診斷體驗。目前Carby已經(jīng)被130+家診所、超過600名醫(yī)療人員使用,舊金山的一家診所表示,使用了Carby后,其就診病人數(shù)量增加了30%。

在谷歌之外,AI芯片巨頭英偉達也在醫(yī)療大模型領域布局多年。

2021年,英偉達宣布與Schrodinger(美醫(yī)療資訊技術公司)建立戰(zhàn)略合作關系,通過提升其計算平臺的速度和精確度,實現(xiàn)快速、準確的評估,加速開發(fā)新的治療方法。

2022年9月,英偉達發(fā)布了用于訓練和部署超算規(guī)模的大型生物分子語言模型——BioNeMo,幫助科學家更好地了解疾病并尋找治療優(yōu)解,BioNeMo還提供云API服務支持預訓練AI模型。今年7月,英偉達又向生物技術公司Recursion投資5000萬美元,支持開發(fā)和訓練在生物和化學領域的AI基礎模型。

教育領域也是美國大模型應用落地的重要場景之一,其核心應用主要集中于語言學習、在線課程與輔助學習三個層面。其標志性案例是美國在線教育組織Khan Academy于4月發(fā)布的基于GPT-4模型,具有輔導教學、教案生成、寫作訓練、編程練習等功能的AI助教Khanmigo。

目前,Khan Academy已經(jīng)實現(xiàn)商業(yè)化運作,付費標準為9美元/月或者99美元/年。其中,輔導教學可以為學生進行一對一輔導。Khanmigo會主動解釋答題思路,并引導學生進行答題的思維訓練,直至學生自己計算出正確答案;此外,Khanmigo還可以作為寫作指導老師,根據(jù)人物特征、故事背景等具體細節(jié),提示和建議學生以不同的切入點進行寫作、辯論等,釋放學生的創(chuàng)造力。

強大的意圖理解和自然語言交流能力,以及文本和圖像生成能力,讓Khanmigo可以真正理解學生,有針對性地給學生提供個性化的學習建議,并且大幅提升教材的供給,包括寓教于樂的課件、豐富的課外資料等,這讓教育的“千人千面”有了實現(xiàn)的可能,也正對行業(yè)產生重要影響。

綜合來看,美國大模型還在加速與產業(yè)的融合發(fā)展,新的產業(yè)革命也正因此發(fā)生。

【中國優(yōu)勢與機遇】

從全球范圍來看,中美兩國引領著大模型的發(fā)展。

根據(jù)《中國人工智能大模型地圖研究報告》,目前全球累計發(fā)布大模型202個,其中中美兩國大模型數(shù)量占全球大模型總數(shù)量的近80%。全球大模型之爭實際上是中美兩國的競賽。

中國大模型的參與者同樣眾多,頭部科技企業(yè)(阿里、百度、騰訊、華為等)、新創(chuàng)公司(智譜AI、百川智能等)、傳統(tǒng)AI企業(yè)(科大訊飛、商湯科技等)以及高校研究院(清華、復旦、中科院等)均已深度布局,并正逐漸形成互聯(lián)網(wǎng)巨頭通用模型領跑、AI廠商、創(chuàng)業(yè)公司及科研院所百花齊放的格局。

雖然目前美國在大模型領域呈現(xiàn)出領跑態(tài)勢,而且對中國采取了諸如禁止美國企業(yè)向中國提供云計算以及大模型訓練服務等打壓措施,中國大模型依然有著巨大發(fā)展機遇,并具備超越美國的基礎。

首先是,中國從政府到業(yè)界都在力推大模型的發(fā)展與趕超。據(jù)《金融時報》報道,中國已在全球前十的大模型研發(fā)機構中占據(jù)四席,分別是百度、BAAI智源研究院、清華大學以及阿里巴巴研究院。百度的“文心一言”、阿里巴巴的“通義千問”等都是我國自研的大模型,其性能足以與美國的大模型一較高下。

Leonis Capital報告分析表示,相較于美國企業(yè)更加重視底層研發(fā)能力,中國百度、阿里等領先巨頭之外的絕大多數(shù)企業(yè),更偏框架、行業(yè)應用層面的研發(fā),而這種差異將為中國帶來巨大機會,讓中國在生成式AI應用和大模型行業(yè)解決方案應用領域超越美國,最終以應用領先倒逼或支持基礎端的趕超。

因為,中國雖然在底層研發(fā)技術上相較于美國略顯遜色,但卻具有超大的市場規(guī)模以及豐富的應用場景,可以為大模型的落地應用提供廣闊的空間和條件,進而通過行業(yè)應用先行來帶動整體的突破。

大模型一個很重要的特征是,應用和技術的雙輪驅動。也就是說,消費者在使用大模型的時候,并不僅僅是貢獻利潤,還可以通過數(shù)據(jù)回環(huán),使大模型獲得更多的反饋,從而提升神經(jīng)網(wǎng)絡的能力。豐富的場景可以讓大模型更加突出實用性,并匹配需求取得更好的效果,也帶動更快的技術發(fā)展。

基于這一特征,中國若能依托巨大的市場規(guī)模以及豐富的場景,把握住應用這個關鍵,尊重市場規(guī)律,持續(xù)從市場應用中獲得利潤,再反饋給資金和人才的積累,最終在底層技術上突破將是水到渠成的事。

作為國內AI大模型領軍者的李彥宏近日也在極客公園創(chuàng)新大會2024上表示,“大模型時代的來臨,真正的價值在于原生應用。”

李彥宏認為,大模型本身并不是大多數(shù)人的創(chuàng)新和創(chuàng)業(yè)機會,原生應用才是。無論對于大廠,還是中小企業(yè),創(chuàng)業(yè)者,原生應用都是很大的機會。

李彥宏說,看到媒體、社會、公眾主要的興奮點還在基礎模型上,沒有轉到AI原生應用上,“我多多少少有點著急!弊罱鼛状喂_發(fā)言,也括公司內部講話,他也都是在不停的強調。“我們一定要去卷AI的原生應用,要把這個東西做出來了,你的模型才有價值!

事實上,中國已經(jīng)在互聯(lián)網(wǎng)與移動互聯(lián)網(wǎng)領域,通過豐富的場景以及應用創(chuàng)新取得領先的發(fā)展,并最終帶動整個科技產業(yè)的進步,在大模型領域,這一趨勢也正在繼續(xù)。但對比中美在互聯(lián)網(wǎng)領域的發(fā)展,有一點倒是值得中國大模型企業(yè)現(xiàn)在就高度重視:更早地在海外布局,朝向全球化發(fā)展。

如今的中國企業(yè),也更有基礎出海,在全球市場找到更加廣闊的發(fā)展空間。

——END——

歡迎關注【華商韜略】,識風云人物,讀韜略傳奇。

版權所有,禁止私自轉載

部分圖片來源于網(wǎng)絡

如涉及侵權,請聯(lián)系刪除

       原文標題 : ChatGPT之外,美國大模型搞到什么程度了?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號