訂閱
糾錯(cuò)
加入自媒體

在AI與信息交互之間:QQ 瀏覽器的邊界探索之旅

2021-12-02 09:13
腦極體
關(guān)注

互聯(lián)網(wǎng)1.0時(shí)代,網(wǎng)絡(luò)是人們查閱資料、了解世界的重要窗口,這個(gè)時(shí)期人與信息的關(guān)系是單向的,信息如一本本靜態(tài)的電子化書本需要用戶觸及后再閱覽獲;

互聯(lián)網(wǎng)2.0時(shí)代,互聯(lián)網(wǎng)開始成為人們獲取價(jià)值信息和社交不可或缺的重要工具,人與信息的關(guān)系開始有了雙向的交互,信息與人共同編織、豐富著這張時(shí)代大網(wǎng)。

隨著推薦技術(shù)成熟以及信息流業(yè)務(wù)急速擴(kuò)張,用戶與內(nèi)容的交互模式逐漸從“人找內(nèi)容-搜索”向“內(nèi)容找人-推薦”遷移,并且這種趨勢仍在擴(kuò)大它的外延。搜索作為人與內(nèi)容信息交互的一種重要方式,它的作用并沒有削弱,用戶在推薦場景的沉浸消費(fèi)反而會(huì)激發(fā)出新的搜索需求。

從本質(zhì)上看,搜索與推薦關(guān)注的交匯點(diǎn)都是交互的核心——用戶興趣,因此如何在當(dāng)前信息分發(fā)場景中更好滿足用戶興趣是一個(gè)重要命題。而瀏覽器是用戶在互聯(lián)網(wǎng)2.0時(shí)代與世界交互信息的重要入口,也是展示搜索與推薦技術(shù)精進(jìn)的絕佳觀察點(diǎn)。

在AI與信息交互之間:QQ 瀏覽器的邊界探索

瀏覽器作為一款綜合性APP,承載了搜索、信息流推薦、小說等多種用戶消費(fèi)信息的場景。這些場景都有大量的內(nèi)容理解、內(nèi)容生成方面的AI需求。不同的場景都有各自的特點(diǎn),比如搜索的Query意圖分類、信息流的內(nèi)容推薦、小說的內(nèi)容分類等。

這些特點(diǎn)也讓瀏覽器成為全面觀察AI技術(shù)在自然語言語義理解方向發(fā)展很好的窗口,跟隨推薦技術(shù)的發(fā)展脈絡(luò),我們發(fā)現(xiàn)騰訊旗下的QQ瀏覽器應(yīng)用月活用戶已經(jīng)超過4億,儼然成長為瀏覽器中的超級APP。

在國內(nèi),騰訊是較早大規(guī)模實(shí)踐AI推薦技術(shù)的廠商之一,旗下的QQ瀏覽器過去幾年來在AI和推薦技術(shù)方面經(jīng)歷了幾次大規(guī)模重構(gòu)和迭代,現(xiàn)在已經(jīng)蔚然成森。這幾年QQ 瀏覽器在技術(shù)層經(jīng)歷了怎樣的厚積?在信息繭房和視頻化難題的泥沼中,QQ 瀏覽器做出了哪些選擇?其實(shí)戰(zhàn)經(jīng)歷對于瀏覽器行業(yè)來說,還是具有一定的學(xué)習(xí)和參考價(jià)值的,值得我們探討一下。

信息流“沼澤”中QQ瀏覽器面對的選擇

在瀏覽器中,信息流主feed是圖文、短視頻、小視頻混合形態(tài),這也是推薦算法應(yīng)用的主場景。在這些場景中,瀏覽器在不斷發(fā)展的進(jìn)階過程中容易遇到這些痛點(diǎn)難題:

1.信息繭房現(xiàn)象。內(nèi)容和資訊類平臺(tái)不光要推薦熱門的信息內(nèi)容,也面臨解決一些初始信息的冷啟動(dòng)問題,推薦系統(tǒng)如何公正有效的推薦優(yōu)質(zhì)內(nèi)容,使得好內(nèi)容獲得更多的曝光機(jī)會(huì),觸達(dá)更多的人群。

2.面對具有豐富場景的瀏覽器,其背后的AI研發(fā)需求多樣復(fù)雜,傳統(tǒng)的研發(fā)模式研發(fā)周期長,效率低。比如內(nèi)容視頻化方向,怎么打更好的標(biāo)簽以及做更好的多模態(tài),對視頻的理解和多模態(tài)的理解如何做到準(zhǔn)確把控等。

3.細(xì)分場景的多樣化與精細(xì)化運(yùn)營的需求,信息流目前發(fā)展到了精細(xì)化運(yùn)營的階段,需要針對多種多樣的細(xì)分場景進(jìn)行敏捷優(yōu)化。

在AI與信息交互之間:QQ 瀏覽器的邊界探索

無論是對于用戶來說,信息內(nèi)容的繭房現(xiàn)象帶來的一畝三分地的局限“視野”,還是企業(yè)面臨的形態(tài)復(fù)雜、內(nèi)容多樣化進(jìn)階的AI技術(shù)需求等,這些對信息流內(nèi)容產(chǎn)生影響的挑戰(zhàn)都亟需解決,為內(nèi)容信息的獲取和交互還一片輕快的價(jià)值體驗(yàn)。

QQ瀏覽器在面對上述挑戰(zhàn)中,選擇運(yùn)用預(yù)訓(xùn)練+finetune+AutoML的新范式和多目標(biāo)多場景聯(lián)合優(yōu)化的新深度模型等創(chuàng)新來應(yīng)對信息流這方面的技術(shù)挑戰(zhàn)。在騰訊QQ 瀏覽器舉辦的AI算法大賽中也可以窺視到多模態(tài)技術(shù)與超參數(shù)對這些瀏覽器難題的優(yōu)化,這兩個(gè)技術(shù)也是此次比賽的兩條賽道。

比如在視頻流的場景中,多模態(tài)的技術(shù)可以根據(jù)視頻觀看的時(shí)間及關(guān)注的興趣及行為讓下一個(gè)視頻更符合、相似目前觀看的視頻,在語義上的相似可以讓用戶的體驗(yàn)更好。QQ 瀏覽器在多模態(tài)技術(shù)中也做了評價(jià)視頻語義相似度的問題,可以更精確地評價(jià)兩個(gè)視頻的文本區(qū)別,為用戶不再推薦重復(fù)的內(nèi)容,增強(qiáng)在推薦方面的泛化和興趣探索的能力,很好地緩解信息繭房的問題。

而超參數(shù)技術(shù)可以實(shí)現(xiàn)多目標(biāo)融合,也就是在推薦系統(tǒng)中,從刷視頻的點(diǎn)擊率演進(jìn)到點(diǎn)擊、關(guān)注、點(diǎn)贊等同時(shí)完成,超參數(shù)搜索把以前人工尋參的方式通過網(wǎng)格搜索、非個(gè)性化尋參到個(gè)性化尋參的方式提升效率。在騰訊QQ瀏覽器實(shí)踐過程中可以減少 80% 以上的尋參時(shí)間,大大提升了推薦系統(tǒng)的研發(fā)效率。

我們知道瀏覽器在實(shí)際的推薦和搜索業(yè)務(wù)場景中,有異常豐富且持續(xù)演化的內(nèi)容需求,這些龐大的內(nèi)容數(shù)據(jù)并沒有客觀清晰的定義,數(shù)據(jù)標(biāo)注也就成為內(nèi)容算法研發(fā)的核心瓶頸,而預(yù)訓(xùn)練大模型是解決這一問題的“良藥”。

聚焦推薦與搜索:當(dāng)瀏覽器擁抱大模型

預(yù)訓(xùn)練大模型也是近兩年AI產(chǎn)業(yè)中最火的關(guān)鍵詞之一。目前比較有名的模型參數(shù)量都已經(jīng)達(dá)到萬億級別了,應(yīng)用場景差異也比較明顯。以 OpenAI斥巨資打造的GPT-3為例,它依然是偏 NLP 的模型。在AI大模型的探索上,無論是著眼于提升超大規(guī)模AI算力,還是突破學(xué)術(shù)前沿的角度,本質(zhì)上都是通過將海量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練、預(yù)集成,形成高魯棒性、低樣本量需求的大模型。企業(yè)可以根據(jù)自身的應(yīng)用場景,在大模型的基礎(chǔ)上進(jìn)行少量的調(diào)參即可完成落地。

而瀏覽器與大模型的結(jié)合,可以將瀏覽器背后場景的大量內(nèi)容理解、內(nèi)容生成中的AI研發(fā)所需樣本量大大降低,解決標(biāo)注量與成本這個(gè)在瀏覽器整體業(yè)務(wù)場景中的核心瓶頸。

QQ瀏覽器實(shí)驗(yàn)室自研了預(yù)訓(xùn)練模型“神舟”,這個(gè)模型具有百億參數(shù)的訓(xùn)練能力,可以為搜索、推薦、內(nèi)容理解等多種業(yè)務(wù)場景起到直接幫助,提升各種自然語言理解算法效果。神舟預(yù)訓(xùn)練大模型專注中文自然語言理解,基于預(yù)訓(xùn)練的研發(fā)模式,可以提前把語言語義中通用的知識(shí)學(xué)習(xí)到預(yù)訓(xùn)練模型中,針對下游具體的任務(wù)只需要學(xué)習(xí)任務(wù)相關(guān)的知識(shí)。

在AI與信息交互之間:QQ 瀏覽器的邊界探索

通過該模型QQ 瀏覽器可以微調(diào)和滿足業(yè)務(wù)中出現(xiàn)的如評論理解、搜索 Query 推薦等NLP 需求,可以減少 40% 以上所需的標(biāo)注數(shù)據(jù)量和相應(yīng)的研發(fā)時(shí)間,節(jié)省了標(biāo)注的成本,大大提升了研發(fā)的效率。在學(xué)術(shù)上,也刷新了業(yè)界紀(jì)錄,登頂了中文語言理解測評基準(zhǔn) CLUE 榜單上,成為首個(gè)在中文自然語言理解綜合評測數(shù)據(jù)上超過人類水平的預(yù)訓(xùn)練模型。

當(dāng)前神舟大模型已經(jīng)逐步應(yīng)用于 QQ 瀏覽器的搜索、看點(diǎn)資訊、小說等多個(gè)場景。隨著大模型進(jìn)一步的迭代和實(shí)踐,也會(huì)深度改造 QQ 瀏覽器的搜索推薦能力,更好地理解并滿足用戶表達(dá)背后的意圖與需求。

大算力時(shí)代,機(jī)器變得更加理解信息與人,比如在醫(yī)療領(lǐng)域的問診問答、交互對話等實(shí)際場景中,大模型可以為語義的理解帶來更強(qiáng)的綜合效果,而瀏覽器擁抱大模型,可以更好地沉淀大量的知識(shí),幫助我們更準(zhǔn)確地探索AI與機(jī)器學(xué)習(xí)的邊界。

在全面數(shù)字化遷徙之旅中,我們獲得信息的渠道和服務(wù)方式也變得越來越便捷智能,對于瀏覽器行業(yè)來說,讓人們以優(yōu)質(zhì)的體驗(yàn)零門檻獲取價(jià)值信息是核心訴求,基于這個(gè)變化與訴求,QQ 瀏覽器也將自己的技術(shù)品牌升級為QQ 瀏覽器實(shí)驗(yàn)室以更好地聚焦服務(wù)用戶。

QQ瀏覽器實(shí)驗(yàn)室:走向下一代信息交互

對于下一代信息的交互平臺(tái),每個(gè)人心目中的瀏覽器都不一樣,我們可能會(huì)借助元宇宙的技術(shù),通過手勢、眼神甚至是意識(shí)來操控搜索與推薦,當(dāng)我們進(jìn)入沉浸式的新搜索界面時(shí),可能很多的邊界都會(huì)模糊甚至消失,比如消費(fèi)和應(yīng)用的邊界,體驗(yàn)與內(nèi)容的邊界,體驗(yàn)與創(chuàng)作的邊界等,可能搜索就是一個(gè)創(chuàng)作的引子,發(fā)現(xiàn)就是探索開始的價(jià)值,用戶與內(nèi)容與應(yīng)用開始層層遞進(jìn)深入,體驗(yàn)和交互的方式全面融合。

無論是哪種未來瀏覽器,本質(zhì)上都是搜索網(wǎng)羅信息,精準(zhǔn)推薦價(jià)值內(nèi)容,這也是信息技術(shù)發(fā)展過程中的不變內(nèi)核。無論未來信息交互的前景怎么變化,前提是技術(shù)的不斷更迭、突破才能帶來體驗(yàn)的重構(gòu)。

在AI與信息交互之間:QQ 瀏覽器的邊界探索

(左起:騰訊副總裁郄小虎、信息平臺(tái)與服務(wù)線CTO徐羽、騰訊副總裁殷宇)

QQ瀏覽器瞄準(zhǔn)長線的數(shù)字化趨勢價(jià)值,成立“QQ瀏覽器實(shí)驗(yàn)室”技術(shù)品牌,依靠AI、搜索、大數(shù)據(jù)、推薦算法的技術(shù)研究,提升信息與服務(wù)的獲取效率,幫助用戶零門檻地獲取價(jià)值信息和服務(wù),革新用戶與世界的交互方式。

近些年來,我們發(fā)現(xiàn)騰訊越來越重視AI技術(shù)能力的構(gòu)建,也成立了一些技術(shù)品牌,比如TEG(技術(shù)工程事業(yè)群)和CSIG(云與智慧產(chǎn)業(yè)事業(yè)群),這也是大家心目中離技術(shù)最近的品牌。以內(nèi)容為主的PCG并沒有得到足夠的關(guān)注。隨著PCG技術(shù)中臺(tái)的成立,推薦AI中臺(tái)也成為騰訊技術(shù)平臺(tái)中的核心中臺(tái),而QQ瀏覽器實(shí)驗(yàn)室是PCG技術(shù)中臺(tái)的核心支撐中臺(tái)模塊之一,不斷為騰訊的推薦業(yè)務(wù)賦能。

實(shí)驗(yàn)室是創(chuàng)新不斷誕生并生根發(fā)芽的地方,搜狗搜索團(tuán)隊(duì)并入后,全網(wǎng)搜索的技術(shù)能力與騰訊垂直搜索的能力形成互補(bǔ),強(qiáng)強(qiáng)聯(lián)手,這個(gè)實(shí)驗(yàn)室就聚合了信息交互中最核心的兩個(gè)技術(shù),可能是我們邁入未來沉浸式搜索交互的第一步。

在AI與信息交互之間:QQ 瀏覽器的邊界探索

我們知道,信息技術(shù)交互平臺(tái)的發(fā)展不斷進(jìn)階的目標(biāo)就是消除鴻溝與隔閡,縮短人與人、人與信息的距離。騰訊信息平臺(tái)與服務(wù)線CTO徐羽也公開表示QQ 瀏覽器的進(jìn)階目標(biāo),與之相似都是緊密連接信息與價(jià)值,拓寬用戶了解世界的眼界。打造互聯(lián)網(wǎng)未來30年的信息服務(wù)工具,做技術(shù)的擺渡人,讓價(jià)值信息更好地網(wǎng)羅服務(wù)生活,成為探索未知的下一代超級窗口。

人類歷史的長河中,隨著信息技術(shù)的不斷更迭,會(huì)越來越注重信息與價(jià)值的準(zhǔn)確與高效,這也就意味著推薦系統(tǒng)是個(gè)無限增長且沒有最優(yōu)解的技術(shù)體系,不斷進(jìn)化是它的特點(diǎn),因此理解用戶的能力也會(huì)不斷地深入,這樣持續(xù)洞察探索推薦的新趨勢和方向,會(huì)為用戶帶來新一代的交互體驗(yàn)與價(jià)值賦能。

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號