訂閱
糾錯
加入自媒體

大模型落地,搜索先成卷王

文 | 戴菁 

大模型重新詮釋了「中國速度」。自從今年3月百度發(fā)布國內(nèi)首個類GPT產(chǎn)品以來,短短3個月時間,國內(nèi)已經(jīng)跑出79個10億參數(shù)規(guī)模以上的大模型。

《中國人工智能大模型地圖研究報告》還提供了另外一個觀察視角:美國和中國發(fā)布的通用大模型總數(shù)已占全球發(fā)布量的80%。很明顯,中美兩國的科技企業(yè)正在成為這輪席卷全球的生成式AI革命的主要推手。

Open AI和微軟構(gòu)成的聯(lián)合陣營,已經(jīng)在教育、投行、辦公領(lǐng)域打造出多個標(biāo)桿級的應(yīng)用落地場景,如堪稱王炸的Office全家桶、語言學(xué)習(xí)平臺Duolingo的AI陪練、摩根士丹利的數(shù)十萬頁知識庫,以及支付服務(wù)平臺Stripe用于打擊欺詐的最新解決方案。這些落地案例同時涵蓋了B端和C端。相較之下,國內(nèi)大模型的上線速度之爭剛剛告一段落,大規(guī)模商業(yè)應(yīng)用落地還在路上。

這段路極具挑戰(zhàn),但至關(guān)重要。百度CEO李彥宏最近在一次會議上強調(diào),「新的國際競爭戰(zhàn)略關(guān)鍵點不是一個國家有多少個大模型,而是你的大模型上有多少原生的AI應(yīng)用,這些應(yīng)用在多大程度上提升了生產(chǎn)效率。」

公開信息顯示,跑在最前面的文心一言,目前已經(jīng)推出11個行業(yè)大模型,覆蓋汽車、能源電力等多個to B領(lǐng)域。

此時誰能打響大模型to C應(yīng)用第一槍,成為備受關(guān)注的一個焦點。注意,是商業(yè)應(yīng)用上的打「響」,而不是PPT層面的「打出」。

圖源:《中國人工智能大模型地圖研究報告》

站在C端用戶視角,《降噪NoNoise》認(rèn)為,教育和搜索兩個領(lǐng)域都有機會:教育無需贅言,從那些AI學(xué)習(xí)機等終端硬件的熱賣不難看出,要說大模型的剛需付費群體,還得是家長;至于搜索,擁有GPT的新Bing可以讓微軟CEO納德拉驕傲地說出——是微軟讓谷歌「跳舞」,可見大模型為搜索帶來的想象空間有多大,而且搜索本身就是世界上規(guī)模最大的AI應(yīng)用場景。

同時看到這一前景的百度也在不舍晝夜地「煉丹」。通過密集推出「AI伙伴」等生成式AI產(chǎn)品,百度希望加快將搜索帶入新時代,并繼續(xù)保持市場引領(lǐng)者的地位。

問題來了,搜索會打響大模型大規(guī)模應(yīng)用的第一槍嗎?

01

搜索框背后的幾個真相

在回答這個問題之前,我們需要先界定搜索與大模型的關(guān)系本質(zhì)。

ChatGPT橫空出世后,一種聲音認(rèn)為谷歌、百度等搜索巨頭都將被顛覆,Open AI 會成為搜索游戲規(guī)則的改變者。

最負(fù)盛名的代表人物是微軟聯(lián)合創(chuàng)始人比爾·蓋茨。他在年初預(yù)言,未來的頂級AI公司會在AI個人助理上發(fā)力,用戶永遠(yuǎn)不會再去搜索網(wǎng)站和亞馬遜。盡管在2019年9月之前,蓋茨對Open AI的技術(shù)能力一直存疑,還被馬斯克懟過「對AI的理解十分有限」。

置身事內(nèi)的搜索巨頭們顯然持有不同看法!肝矣X得應(yīng)該會加強百度的地位,因為ChatGPT要解決的問題很多就是搜索要解決的問題,它們的目標(biāo)是一致的!菇谠谝粰n名為《新智者首席Time》的欄目訪談中,百度副總裁、搜索平臺負(fù)責(zé)人肖陽作出自己的判斷。自2004年加入百度,肖陽見證了搜索行業(yè)20年的發(fā)展歷程。

從演進(jìn)路線來看,搜索引擎誕生之初要解決的是信息獲取效率的問題,為用戶提供從提問到答案的最短路徑。此前類似的檢索任務(wù)先后由《大英百科全書》、網(wǎng)絡(luò)黃頁等信息工具來承載,直至算法出現(xiàn)。

算法讓搜索引擎天然擁有AI基因,因為機器執(zhí)行任務(wù)的前提是「理解」搜索框背后的需求。

只不過在不同階段,信息匹配的方式各不相同。

以肖陽入行的2004年為例,當(dāng)時搜索引擎還處于關(guān)鍵詞檢索時代——用戶要像在圖書館里搜書一樣,在搜索框敲下關(guān)鍵詞,然后通過不斷變化關(guān)鍵詞,找到精準(zhǔn)匹配的網(wǎng)頁內(nèi)容。

當(dāng)年百度搜索的PM內(nèi)部還會舉辦比賽,試圖不斷尋找更快搜到目標(biāo)資料的方法。

后來用戶的需求越來越強,從關(guān)鍵詞檢索變成提問題,搜索演變成非對稱性匹配,即當(dāng)用戶提問后,搜素引擎給出的是類似專家咨詢式的回答。打個比方,用戶問「明天天氣怎么樣?」,答案可能是「雷陣雨伴有短時大風(fēng)」。這個回答中壓根沒有出現(xiàn)與問題交叉的關(guān)鍵詞。

該匹配模式要求搜索引擎對用戶問題及全網(wǎng)內(nèi)容這兩端都要有更深入的「理解」。

這大概能解釋,為什么2013年百度、谷歌、微軟都會不惜代價參與對「深度學(xué)習(xí)之父」杰夫·辛頓教授的公司的收購競拍。

當(dāng)時辛頓教授剛剛?cè)〉蒙疃壬窠?jīng)網(wǎng)絡(luò)技術(shù)的重大突破,搜索巨頭是最早嗅到技術(shù)潛力的一批公司——深度學(xué)習(xí)有望提升搜索效率。事后看,搜索也為深度學(xué)習(xí)提供了最早的應(yīng)用落地場景。百度、谷歌都是最早布局深度學(xué)習(xí)的科技巨頭,百度大腦、谷歌大腦后來也都成為頂級AI開放平臺。

圖:杰夫·辛頓

大約從2018年、2019年開始,深度學(xué)習(xí)又迎來一輪突飛猛進(jìn),搜索引擎的語義變革繼續(xù)演進(jìn)。谷歌、百度等搜索巨頭的大語言模型越來越大,模型能力越來越強,智能搜索引擎雛形已現(xiàn)。以百度為例,其在2019年便推出文心大模型1.0,此后持續(xù)迭代到2.0、3.0版本。

正是基于這些積累,在ChatGPT發(fā)布后,谷歌和百度能很快推出Bard、文心一言。外界看似一夜間長出來的大模型產(chǎn)品,實則是搜索巨頭多年業(yè)務(wù)實踐積累的產(chǎn)物。

被ChatGPT搶了風(fēng)頭后,谷歌CEO Sundar Pichai在一次采訪中不無憋屈地說,「實際上我們已經(jīng)擁有AI模型十幾年了!

百度創(chuàng)始人、董事長兼CEO李彥宏也在公開演講中數(shù)次強調(diào),無論是哪家公司,都不可能靠突擊幾個月就能做出(文心一言)這樣的大語言模型!干疃葘W(xué)習(xí)、自然語言處理,需要多年的堅持和積累,沒法速成。」

02

搜索之變

搜索引擎發(fā)展到今天,已經(jīng)成為世界上規(guī)模最大的AI應(yīng)用場景和成功的商業(yè)模式。

從技術(shù)演進(jìn)來看,似乎也很難得出搜索被大模型顛覆的結(jié)論。如果說狹義的搜索只是一個「搜索框」,廣義的搜索則是用戶表達(dá)和機器反饋的一個過程,而搜索框、對話框只是不同的人機交互形式。

這也是肖陽為什么會說GPT和搜索引擎目標(biāo)一致的底層邏輯。甚至大模型會讓頭部搜索引擎在競爭格局中處于更加有利的位置,因為搜索有馬太效應(yīng)——擁有更多用戶、技術(shù)、數(shù)據(jù)和算力的公司,產(chǎn)品效果會越來越好。

全球至今只有美中俄韓4個國家擁有本土搜索引擎不是沒有道理的。作為一項互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,后來者很難顛覆格局。當(dāng)然歐盟還是不信邪,2022年曾掏5800萬元試圖打造一個歐盟自己的開放搜索引擎,以替代谷歌,目前還沒有下文。

基礎(chǔ)大模型也有相似特點,跑在前面的會跑得越來越快!赴俣纫皇钟兴阉,一手有文心一言大模型或者說生成式AI技術(shù),就像同時持有倚天劍、屠龍刀,雙劍合璧會產(chǎn)生更大的價值!乖谧鞔伺袛嗟耐瑫r,肖陽也承認(rèn),頭部搜索引擎并不能因此在競爭中松懈半分,理應(yīng)讓用戶體驗發(fā)生迅猛的變化。

「其實這個事很簡單,你讓用戶滿意了,用戶就留下來,你讓用戶感知到你能夠使他滿意,新用戶就會來,你讓他不滿意,他就會走!

用李彥宏的話說:永遠(yuǎn)不要以任何方式遏制用戶的需求表達(dá)。

用戶需求表達(dá)的升級,只能用技術(shù)的升級來回應(yīng)。在生成式AI出現(xiàn)之前,用戶的需求表達(dá)方式已經(jīng)呈現(xiàn)出越來越豐富、多元的趨勢,比如更多口語化、模糊化表達(dá)、對圖片和視頻類信息搜索需求上升。

對此,搜索引擎巨頭們紛紛在語意推理模型的基礎(chǔ)上強化跨模態(tài)能力,類似后來的GPT-4。

大語言模型的出現(xiàn)也把搜索引擎帶到更為智能的階段——能聽會看,越來越懂用戶。過去人們調(diào)侃:谷歌可以給你10萬個答案,但是一個圖書管理員可以給你最為精準(zhǔn)的答案。如今,大模型讓搜索引擎解決問題的能力更強,并開始朝著廣義的搜索生成體驗演進(jìn)。

從行業(yè)引領(lǐng)者百度最新探索的一系列路徑,我們可以看到這種演進(jìn)趨勢的眉目。

通過「卷」起自己,百度把「極致滿足」比例提升為搜索內(nèi)部隱形OKR。

所謂極致滿足,就是在用戶問出一個問題后,看搜索引擎給出的首條回答能不能解決你的問題。

首條回答的形式不僅有文字,還有視頻,搜索引擎可以從一段視頻中抽取出關(guān)鍵摘要。比如當(dāng)家長想找一部教小朋友畫畫的藝術(shù)動畫片,以前需要花時間去瀏覽、篩選、判斷和總結(jié)。而現(xiàn)在,百度搜索可以為用戶整理多個答案,并標(biāo)注每個答案被提到的次數(shù),每個答案中還包含更豐富的內(nèi)容,大大節(jié)省了家長的精力。

另外一個有意思的探索在于「權(quán)威回答」。ChatGPT出現(xiàn)后,人們在震撼之余很快發(fā)現(xiàn),它還會一本正經(jīng)地胡說八道。計算機「幻覺」的存在,讓部分內(nèi)容的真實可信度打個問號。百度搜索的新功能,則可以引用書籍直接回答提問,以增加信任感。

當(dāng)你問出某個問題,搜索引擎可能會告訴你在這個問題在哪本書里寫過,隨后是進(jìn)一步有拓展的閱讀,其相當(dāng)于一個AI時代圖書管理員的角色。

肖陽透露,百度搜索一直在關(guān)注「極致滿足」數(shù)據(jù):半年前,「首條滿足」比例只有40%;現(xiàn)在達(dá)到70%。且從數(shù)據(jù)變化來看,用戶是愿意為搜索體驗的上升而買單的——今年以來,百度搜索日均新增問答需求超過5000萬次。

作為搜索代際變革的一部分,能聽會看的「AI伙伴」也走上重要位置。百度在今年5月底的移動生態(tài)大會上首次演示了內(nèi)測「AI伙伴」的能力。

現(xiàn)場Demo顯示中,它不只是一個聊天機器人的對話界面,還能幫助用戶標(biāo)記答案重點、提供權(quán)威來源,總結(jié)文檔概要,同時支持調(diào)用各種工具和服務(wù),以及根據(jù)用戶意圖制作圖片或進(jìn)行文案創(chuàng)作。

據(jù)了解,這個「AI伙伴」目前還在內(nèi)測當(dāng)中,用戶的許多需求讓工程師意想不到,預(yù)計未來「AI伙伴」的能力都會持續(xù)演進(jìn)。

不過未來會否進(jìn)入比爾·蓋茨所預(yù)言的AI個人助理時代,最終還要依賴搜索引擎與大模型的融合程度。這條路徑充滿挑戰(zhàn),同時也被想象力鋪滿黃金。

03

新故事

在去年的一場媒體交流中,肖陽曾聊到一個問題:搜索做到最后,拼什么?

業(yè)內(nèi)公認(rèn),搜索是互聯(lián)網(wǎng)領(lǐng)域難度最高的業(yè)務(wù)之一,它可是一個簡單的搜索框,也可能是一個非常開放的體系。但這個市場從來不乏挑戰(zhàn)者。前兩年,字節(jié)、華為等都有積極布局相關(guān)業(yè)務(wù)。彼時ChatGPT還沒有帶來顛覆性變革。

肖陽當(dāng)時的回答是,最終拼對用戶的理解、對技術(shù)的投入以及能否把搜索做到極致的能力。如今大模型的智能涌現(xiàn),讓所有人同時看到了做到極致的方向——搜索生成體驗,甚至輔助決策。

這些進(jìn)化反過來不斷激發(fā)新的用戶需求。

大模型也讓百度搜索有了新故事。過去百度只是一個需求的「起點」,用戶獲取信息后,再去到其他網(wǎng)站或者App獲得服務(wù)場景,比如電商、本地生活或者內(nèi)容創(chuàng)作。

為了提升服務(wù)價值,百度陸續(xù)通過布局小程序、百家號等產(chǎn)品進(jìn)一步豐富搜索的內(nèi)容生態(tài),希望以此讓用戶能夠一站式解決問題,享受閉環(huán)服務(wù)。放眼全球搜索行業(yè),這種生態(tài)戰(zhàn)略布局都有領(lǐng)先價值。

不過大模型出現(xiàn)以前,補齊理想的生態(tài)閉環(huán)需要更長的時間和耐心,因為工具類產(chǎn)品都有用戶粘性和停留時長的挑戰(zhàn)。

大模型加速了閉環(huán)的形成,它拉通了提問、找答案、決策落地的全過程,搜索引擎也因此獲得更大的商業(yè)想象力。這大概是所謂「雙劍合璧」的商業(yè)價值。

幾乎可以預(yù)見,融合更多人工智能創(chuàng)新應(yīng)用后,搜索引擎?zhèn)兛赡軙蛟煲粋更有活力的生態(tài)系統(tǒng)。 

從百度等公司今年以來密集亮出的「武器庫」、「路線圖」來看,搜索主要玩家大概率不會被顛覆,相反會作為顛覆式創(chuàng)新的主要參與者,繼續(xù)推動技術(shù)變革。

       原文標(biāo)題 : 大模型落地,搜索先成卷王

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號