訂閱
糾錯(cuò)
加入自媒體

國(guó)產(chǎn)大模型發(fā)布,我們都涉身其中了

百度文心一言、訊飛星火,國(guó)產(chǎn)的大模型陸續(xù)開放給普通用戶了,這也是人工智能AI的新階段產(chǎn)品、預(yù)訓(xùn)練語(yǔ)言大模型(LLM)產(chǎn)品在國(guó)內(nèi)的首批產(chǎn)品。文心一言、訊飛星火上線后,很快都登上了國(guó)內(nèi)蘋果和安卓應(yīng)用商店的免費(fèi)應(yīng)用排行版前列。

從去年11月30日OpenAI公司推出ChatGPT的9個(gè)月后,中國(guó)版產(chǎn)品也跟上了,國(guó)內(nèi)民眾終于可以合法、穩(wěn)定地體驗(yàn)、使用新科技。 

01大模型之前AI什么?

在人工智能之前的歷史上,有過(guò)5大相對(duì)成熟的應(yīng)用:機(jī)器翻譯、搜索引擎、圖像識(shí)別、語(yǔ)音識(shí)別和智能客服。

其中圖像識(shí)別和語(yǔ)音識(shí)別領(lǐng)域滋養(yǎng)了最多的有規(guī)模的創(chuàng)業(yè)公司,有非?捎^的投資和收入規(guī)模,著名的公司包括商湯、曠視,科大訊飛、云知聲等等。

智能客服在銀行、通信運(yùn)營(yíng)商和IT、互聯(lián)網(wǎng)等面向大規(guī)模用戶的企業(yè)中應(yīng)用廣泛,以前采用專家系統(tǒng),一種半智能的問(wèn)答系統(tǒng)。后來(lái)全面轉(zhuǎn)到自然語(yǔ)言等技術(shù)后,AI和自動(dòng)化水平明顯提高,普通民眾對(duì)此感受深刻,同時(shí)也有了很多面對(duì)機(jī)器人的無(wú)奈。著名產(chǎn)品有騰訊企業(yè)、環(huán)信、網(wǎng)易七魚等。

機(jī)器翻譯最早的版本是2006年由谷歌公司推出,10年后的2016年推出了深度學(xué)習(xí)版的翻譯引擎,翻譯效果明顯提高,達(dá)到民用基本無(wú)誤的水平。谷歌、必應(yīng)和國(guó)內(nèi)的有道、百度翻譯是這個(gè)過(guò)程里的主要角色。

搜索引擎就更加廣為人知了,谷歌的搜索引擎一下把互聯(lián)網(wǎng)的信息檢索從雅虎代表的目錄管理水平,(可以想見目錄管理源自傳統(tǒng)的圖書信息管理,是圖書時(shí)代向互聯(lián)網(wǎng)時(shí)代進(jìn)化中的過(guò)渡方式。)提高到了面對(duì)海量數(shù)據(jù)使用關(guān)鍵詞搜索的水平。搜索引擎滋養(yǎng)了美中兩大互聯(lián)網(wǎng)巨型公司:谷歌和百度。

而語(yǔ)言大模型產(chǎn)品,不但囊括了上述應(yīng)用,還誕生了自己新的功能:AIGC,就是人工智能自動(dòng)生產(chǎn)內(nèi)容,無(wú)論是文字、繪畫、音樂(lè)還是計(jì)算機(jī)代碼,人工智能產(chǎn)出的內(nèi)容達(dá)到了讓人驚艷和震撼的地步。

這一切,是計(jì)算機(jī)面對(duì)人類誕生以來(lái)的所有知識(shí)和信息的這個(gè)層面上,處理和消化了其中20%多的內(nèi)容后,訓(xùn)練出的能力,代表了人類至今對(duì)數(shù)據(jù)的處理能力、軟件工程能力,以及配套所需的巨量計(jì)算能力的最高水平,已經(jīng)接近達(dá)到顛覆人類自己智力的階層。 

02人們之前怎么使用AI?

按照上述梳理,此前我們?cè)谑褂肁I的時(shí)候,像圖像和語(yǔ)音識(shí)別、智能客服,大部分是場(chǎng)景相對(duì)固定的商業(yè)、專業(yè)應(yīng)用,用戶基本上是被動(dòng)的。咱們來(lái)說(shuō)說(shuō)服務(wù)大眾用戶的機(jī)器翻譯和搜索引擎。

自動(dòng)翻譯是有人類以來(lái)對(duì)AI夢(mèng)想的起點(diǎn)。機(jī)器翻譯從上線那一天開始,對(duì)普通用戶就是免費(fèi)的,但是免費(fèi)中有很多層意思。

免費(fèi)首先意味著它是網(wǎng)站的純投入無(wú)收入的成本部門,沒(méi)有現(xiàn)金收入,對(duì)機(jī)器翻譯的考核加了一項(xiàng)重要指標(biāo)就是流量,作為網(wǎng)站整體服務(wù)的重要一環(huán),留住用戶。谷歌瀏覽器Chrome有一個(gè)功能,就是用谷歌翻譯把整個(gè)頁(yè)面內(nèi)容自動(dòng)翻譯成用戶所需的語(yǔ)種,對(duì)跨語(yǔ)種在網(wǎng)上沖浪的用戶非常友好。

機(jī)器翻譯之所以免費(fèi),還因?yàn)樗鼰o(wú)論號(hào)稱多么準(zhǔn)確,總會(huì)出現(xiàn)對(duì)某個(gè)單詞的錯(cuò)別解釋,整句整段的語(yǔ)義不連貫和錯(cuò)誤地方就更多了,以及無(wú)法糾正的機(jī)器腔——它的遣詞造句對(duì)用戶閱讀來(lái)說(shuō)很別扭,類似星球大戰(zhàn)里機(jī)器人C-3PO——說(shuō)話走路都帶著機(jī)器的味道。這種層次的產(chǎn)品讓用戶付費(fèi)的話,我估計(jì)無(wú)論是工程師和網(wǎng)站的銷售都沒(méi)有這個(gè)底氣,于是機(jī)器翻譯生而免費(fèi)。

最初,產(chǎn)品經(jīng)理和工程師還有一項(xiàng)期待:希望通過(guò)獲取用戶對(duì)翻譯結(jié)果的反饋來(lái)提高機(jī)器翻譯質(zhì)量。這一項(xiàng)指標(biāo)寫在每一任機(jī)器翻譯的產(chǎn)品經(jīng)理的項(xiàng)目報(bào)告里。但是快20年了,反饋還是不足以讓工程師來(lái)訓(xùn)練更好的翻譯引擎。因?yàn)闄C(jī)器翻譯和用戶的交互非常弱,幾乎沒(méi)有人愿意花時(shí)間把自己對(duì)譯文的看法、尤其是對(duì)某個(gè)詞句的具體意見寫下來(lái)提交給運(yùn)營(yíng)方。

所以機(jī)器翻譯雖然在AI一度廣泛使用的自然語(yǔ)言處理技術(shù)NLP中,被稱作技術(shù)應(yīng)用的皇冠,在計(jì)算機(jī)技術(shù)專業(yè)領(lǐng)域存在感是A級(jí);在用戶端受到關(guān)注但是好評(píng)度并不高、存在感降到C級(jí);在商業(yè)和投資價(jià)值方面,它是最末流的D-級(jí)。因此它就是大型互聯(lián)網(wǎng)企業(yè)養(yǎng)育的一頭銷金獸。

搜索引擎是另外一番天地,它滿足了人們上網(wǎng)的第一需求:獲取信息。是搜索引擎第一次真實(shí)實(shí)現(xiàn)了互聯(lián)網(wǎng)上的信息自由。同時(shí)產(chǎn)品經(jīng)理還創(chuàng)造了搜索引擎嵌入廣告和關(guān)鍵詞排名廣告方式,徹底改變傳統(tǒng)世界商業(yè)信息傳播介質(zhì),互聯(lián)網(wǎng)取代了傳統(tǒng)廣播電視報(bào)紙雜志和戶外等媒體,成為獨(dú)大的廣告平臺(tái),谷歌也成為有史以來(lái)廣告收入最多的公司。

搜索引擎中的人工智能,主要體現(xiàn)在兩點(diǎn):一是盡可能對(duì)用戶輸入的搜索關(guān)鍵詞的理解正確,以便展示出最合適的內(nèi)容;第二是對(duì)內(nèi)容庫(kù)里的內(nèi)容進(jìn)行管理,以匹配用戶的需求。

谷歌之所以拿到了有史以來(lái)最大的廣告收入,是因?yàn)樗鼌R集了有史以來(lái)最大的用戶群,擁有最多的用戶畫像和最全的資訊數(shù)據(jù)庫(kù),在幫助建立所有人對(duì)所有信息的鏈接的同時(shí),也建立了商業(yè)買賣的橋梁,搭建了廣告銷售的機(jī)會(huì)。

03我們?cè)趺词褂么竽P停?/strong>

啰啰嗦嗦說(shuō)AI的歷史,是要來(lái)告訴讀者,現(xiàn)在使用大模型會(huì)是一個(gè)什么樣的場(chǎng)景?

大模型的基礎(chǔ)版是免費(fèi)的。這個(gè)免費(fèi)也同樣有很多層意思。

首先當(dāng)然是因?yàn)樗蠥I的缺點(diǎn),它不保證每次提供給你的信息是準(zhǔn)確和正確的,它會(huì)告訴你“我的回答有90%的概率是對(duì)的”,但是哪里不對(duì),什么時(shí)候會(huì)出錯(cuò),AI不知道,工程師們也不知道。

但是大模型之所以說(shuō)橫空出世,是它在類似于無(wú)所不知的搜索引擎的基礎(chǔ)上,把它之前訓(xùn)練模型時(shí)所包括進(jìn)去的信息,用一個(gè)有條理的文檔來(lái)回答你。你可以理解為以前的搜索引擎升級(jí)到了智能搜索1.0版,區(qū)別是以前用戶需要在搜索結(jié)果中逐頁(yè)打開找到自己的目標(biāo)信息。而大模型不但幫你找到,還幫你總結(jié)稱流利通順的文字了。

還有更進(jìn)一步的功能,大模型會(huì)幫你按要求寫作、畫畫、編曲,甚至寫計(jì)算機(jī)代碼,幫助你寫作業(yè),做科學(xué)研究。目前我們但凡涉及到語(yǔ)言(聲音、文字、繪畫、音階、計(jì)算機(jī)代碼)的腦力工作,大模型都可以部分甚至完全替代。

以前人們普遍看不上藍(lán)領(lǐng)的技能&體力工作,沒(méi)想到大模型AI上來(lái)就要替代大部分的白領(lǐng)工作。 

理論上,人們除了睡覺(jué)吃飯出門運(yùn)動(dòng),其他時(shí)間可以全身心撲在大模型上完成自己的學(xué)習(xí)、工作。目前,這些都是免費(fèi)的。

運(yùn)營(yíng)公司因此建立龐大的用戶群,最好只來(lái)我家不去其他家。因此頁(yè)面上大概率會(huì)和其他互聯(lián)網(wǎng)公司一樣,會(huì)出現(xiàn)廣告。同時(shí),即使這邊免費(fèi),大模型還備著很多收費(fèi)的產(chǎn)品要賣給他們呢。對(duì),大模型將是第一次對(duì)大數(shù)量級(jí)的普通用戶收取費(fèi)用的平臺(tái)級(jí)產(chǎn)品,因?yàn)樗獜娜祟愓w積累的知識(shí)與能力的層次上,給你學(xué)習(xí)和職業(yè)的支持。

龐大用戶群的另一個(gè)價(jià)值,就是利用機(jī)器和人的交互對(duì)話,大模型能夠迅速提高自己的智力水平。而對(duì)個(gè)人用戶來(lái)說(shuō),也是你在訓(xùn)練符合你的興趣和需求的個(gè)性化大模型的過(guò)程。所以,大模型類似于每個(gè)人的外腦一樣,越用越離不開。這種終生服務(wù),就是大模型公司正在計(jì)劃和實(shí)施的事情。

如何讓提高大模型的確定性,提高它服務(wù)的正確與準(zhǔn)確度,除了和用戶交互之外,大模型一定邀請(qǐng)了更多小型垂直的應(yīng)用服務(wù)商來(lái)一起開發(fā),比如一個(gè)數(shù)學(xué)學(xué)習(xí)和研究的應(yīng)用,比如一個(gè)腦外科手術(shù)的應(yīng)用。類似于大模型提供通用的判斷和技能,而具體應(yīng)用把具體服務(wù)落地。

以上是目前第一代大模型和用戶相處的場(chǎng)景。

從技術(shù)和產(chǎn)品來(lái)說(shuō),科學(xué)家們相信和人類智能相當(dāng)、甚至超越人類的AI一定會(huì)出現(xiàn)。其中涉及的道德倫理不是本文要討論的,僅就使用而言,一切都剛剛開始,機(jī)器在瘋狂地進(jìn)步,我們也要盡力跟上。

圖片來(lái)源于網(wǎng)絡(luò),侵權(quán)請(qǐng)聯(lián)系刪除。

       原文標(biāo)題 : 國(guó)產(chǎn)大模型發(fā)布,我們都涉身其中了

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)