妹妹在线视频中文字幕日韩,国产免费午夜福利在线播放92

在AI與信息交互之間：QQ 瀏覽器的邊界探索之旅

2021-12-02 09:13

互聯(lián)網(wǎng)1．0時(shí)代，網(wǎng)絡(luò)是人們查閱資料、了解世界的重要窗口，這個(gè)時(shí)期人與信息的關(guān)系是單向的，信息如一本本靜態(tài)的電子化書本需要用戶觸及后再閱覽獲��；

互聯(lián)網(wǎng)2．0時(shí)代，互聯(lián)網(wǎng)開始成為人們獲取價(jià)值信息和社交不可或缺的重要工具，人與信息的關(guān)系開始有了雙向的交互，信息與人共同編織、豐富著這張時(shí)代大網(wǎng)。

隨著推薦技術(shù)成熟以及信息流業(yè)務(wù)急速擴(kuò)張，用戶與內(nèi)容的交互模式逐漸從“人找內(nèi)容－搜索”向“內(nèi)容找人－推薦”遷移，并且這種趨勢仍在擴(kuò)大它的外延。搜索作為人與內(nèi)容信息交互的一種重要方式，它的作用并沒有削弱，用戶在推薦場景的沉浸消費(fèi)反而會(huì)激發(fā)出新的搜索需求。

從本質(zhì)上看，搜索與推薦關(guān)注的交匯點(diǎn)都是交互的核心——用戶興趣，因此如何在當(dāng)前信息分發(fā)場景中更好滿足用戶興趣是一個(gè)重要命題。而瀏覽器是用戶在互聯(lián)網(wǎng)2．0時(shí)代與世界交互信息的重要入口，也是展示搜索與推薦技術(shù)精進(jìn)的絕佳觀察點(diǎn)。

在AI與信息交互之間：QQ 瀏覽器的邊界探索

瀏覽器作為一款綜合性APP，承載了搜索、信息流推薦、小說等多種用戶消費(fèi)信息的場景。這些場景都有大量的內(nèi)容理解、內(nèi)容生成方面的AI需求。不同的場景都有各自的特點(diǎn)，比如搜索的Query意圖分類、信息流的內(nèi)容推薦、小說的內(nèi)容分類等。

這些特點(diǎn)也讓瀏覽器成為全面觀察AI技術(shù)在自然語言語義理解方向發(fā)展很好的窗口，跟隨推薦技術(shù)的發(fā)展脈絡(luò)，我們發(fā)現(xiàn)騰訊旗下的QQ瀏覽器應(yīng)用月活用戶已經(jīng)超過4億，儼然成長為瀏覽器中的超級APP。

在國內(nèi)，騰訊是較早大規(guī)模實(shí)踐AI推薦技術(shù)的廠商之一，旗下的QQ瀏覽器過去幾年來在AI和推薦技術(shù)方面經(jīng)歷了幾次大規(guī)模重構(gòu)和迭代，現(xiàn)在已經(jīng)蔚然成森。這幾年QQ 瀏覽器在技術(shù)層經(jīng)歷了怎樣的厚積？在信息繭房和視頻化難題的泥沼中，QQ 瀏覽器做出了哪些選擇？其實(shí)戰(zhàn)經(jīng)歷對于瀏覽器行業(yè)來說，還是具有一定的學(xué)習(xí)和參考價(jià)值的，值得我們探討一下。

信息流“沼澤”中QQ瀏覽器面對的選擇

在瀏覽器中，信息流主feed是圖文、短視頻、小視頻混合形態(tài)，這也是推薦算法應(yīng)用的主場景。在這些場景中，瀏覽器在不斷發(fā)展的進(jìn)階過程中容易遇到這些痛點(diǎn)難題：

1．信息繭房現(xiàn)象。內(nèi)容和資訊類平臺(tái)不光要推薦熱門的信息內(nèi)容，也面臨解決一些初始信息的冷啟動(dòng)問題，推薦系統(tǒng)如何公正有效的推薦優(yōu)質(zhì)內(nèi)容，使得好內(nèi)容獲得更多的曝光機(jī)會(huì)，觸達(dá)更多的人群。

2．面對具有豐富場景的瀏覽器，其背后的AI研發(fā)需求多樣復(fù)雜，傳統(tǒng)的研發(fā)模式研發(fā)周期長，效率低。比如內(nèi)容視頻化方向，怎么打更好的標(biāo)簽以及做更好的多模態(tài)，對視頻的理解和多模態(tài)的理解如何做到準(zhǔn)確把控等。

3．細(xì)分場景的多樣化與精細(xì)化運(yùn)營的需求，信息流目前發(fā)展到了精細(xì)化運(yùn)營的階段，需要針對多種多樣的細(xì)分場景進(jìn)行敏捷優(yōu)化。

在AI與信息交互之間：QQ 瀏覽器的邊界探索

無論是對于用戶來說，信息內(nèi)容的繭房現(xiàn)象帶來的一畝三分地的局限“視野”，還是企業(yè)面臨的形態(tài)復(fù)雜、內(nèi)容多樣化進(jìn)階的AI技術(shù)需求等，這些對信息流內(nèi)容產(chǎn)生影響的挑戰(zhàn)都亟需解決，為內(nèi)容信息的獲取和交互還一片輕快的價(jià)值體驗(yàn)。

QQ瀏覽器在面對上述挑戰(zhàn)中，選擇運(yùn)用預(yù)訓(xùn)練＋finetune＋AutoML的新范式和多目標(biāo)多場景聯(lián)合優(yōu)化的新深度模型等創(chuàng)新來應(yīng)對信息流這方面的技術(shù)挑戰(zhàn)。在騰訊QQ 瀏覽器舉辦的AI算法大賽中也可以窺視到多模態(tài)技術(shù)與超參數(shù)對這些瀏覽器難題的優(yōu)化，這兩個(gè)技術(shù)也是此次比賽的兩條賽道。

比如在視頻流的場景中，多模態(tài)的技術(shù)可以根據(jù)視頻觀看的時(shí)間及關(guān)注的興趣及行為讓下一個(gè)視頻更符合、相似目前觀看的視頻，在語義上的相似可以讓用戶的體驗(yàn)更好。QQ 瀏覽器在多模態(tài)技術(shù)中也做了評價(jià)視頻語義相似度的問題，可以更精確地評價(jià)兩個(gè)視頻的文本區(qū)別，為用戶不再推薦重復(fù)的內(nèi)容，增強(qiáng)在推薦方面的泛化和興趣探索的能力，很好地緩解信息繭房的問題。

而超參數(shù)技術(shù)可以實(shí)現(xiàn)多目標(biāo)融合，也就是在推薦系統(tǒng)中，從刷視頻的點(diǎn)擊率演進(jìn)到點(diǎn)擊、關(guān)注、點(diǎn)贊等同時(shí)完成，超參數(shù)搜索把以前人工尋參的方式通過網(wǎng)格搜索、非個(gè)性化尋參到個(gè)性化尋參的方式提升效率。在騰訊QQ瀏覽器實(shí)踐過程中可以減少 80％以上的尋參時(shí)間，大大提升了推薦系統(tǒng)的研發(fā)效率。

我們知道瀏覽器在實(shí)際的推薦和搜索業(yè)務(wù)場景中，有異常豐富且持續(xù)演化的內(nèi)容需求，這些龐大的內(nèi)容數(shù)據(jù)并沒有客觀清晰的定義，數(shù)據(jù)標(biāo)注也就成為內(nèi)容算法研發(fā)的核心瓶頸，而預(yù)訓(xùn)練大模型是解決這一問題的“良藥”。

聚焦推薦與搜索：當(dāng)瀏覽器擁抱大模型

預(yù)訓(xùn)練大模型也是近兩年AI產(chǎn)業(yè)中最火的關(guān)鍵詞之一。目前比較有名的模型參數(shù)量都已經(jīng)達(dá)到萬億級別了，應(yīng)用場景差異也比較明顯。以 OpenAI斥巨資打造的GPT－3為例，它依然是偏 NLP 的模型。在AI大模型的探索上，無論是著眼于提升超大規(guī)模AI算力，還是突破學(xué)術(shù)前沿的角度，本質(zhì)上都是通過將海量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練、預(yù)集成，形成高魯棒性、低樣本量需求的大模型。企業(yè)可以根據(jù)自身的應(yīng)用場景，在大模型的基礎(chǔ)上進(jìn)行少量的調(diào)參即可完成落地。

而瀏覽器與大模型的結(jié)合，可以將瀏覽器背后場景的大量內(nèi)容理解、內(nèi)容生成中的AI研發(fā)所需樣本量大大降低，解決標(biāo)注量與成本這個(gè)在瀏覽器整體業(yè)務(wù)場景中的核心瓶頸。

QQ瀏覽器實(shí)驗(yàn)室自研了預(yù)訓(xùn)練模型“神舟”，這個(gè)模型具有百億參數(shù)的訓(xùn)練能力，可以為搜索、推薦、內(nèi)容理解等多種業(yè)務(wù)場景起到直接幫助，提升各種自然語言理解算法效果。神舟預(yù)訓(xùn)練大模型專注中文自然語言理解，基于預(yù)訓(xùn)練的研發(fā)模式，可以提前把語言語義中通用的知識(shí)學(xué)習(xí)到預(yù)訓(xùn)練模型中，針對下游具體的任務(wù)只需要學(xué)習(xí)任務(wù)相關(guān)的知識(shí)。

在AI與信息交互之間：QQ 瀏覽器的邊界探索

通過該模型QQ 瀏覽器可以微調(diào)和滿足業(yè)務(wù)中出現(xiàn)的如評論理解、搜索 Query 推薦等NLP 需求，可以減少 40％以上所需的標(biāo)注數(shù)據(jù)量和相應(yīng)的研發(fā)時(shí)間，節(jié)省了標(biāo)注的成本，大大提升了研發(fā)的效率。在學(xué)術(shù)上，也刷新了業(yè)界紀(jì)錄，登頂了中文語言理解測評基準(zhǔn) CLUE 榜單上，成為首個(gè)在中文自然語言理解綜合評測數(shù)據(jù)上超過人類水平的預(yù)訓(xùn)練模型。

當(dāng)前神舟大模型已經(jīng)逐步應(yīng)用于 QQ 瀏覽器的搜索、看點(diǎn)資訊、小說等多個(gè)場景。隨著大模型進(jìn)一步的迭代和實(shí)踐，也會(huì)深度改造 QQ 瀏覽器的搜索推薦能力，更好地理解并滿足用戶表達(dá)背后的意圖與需求。

大算力時(shí)代，機(jī)器變得更加理解信息與人，比如在醫(yī)療領(lǐng)域的問診問答、交互對話等實(shí)際場景中，大模型可以為語義的理解帶來更強(qiáng)的綜合效果，而瀏覽器擁抱大模型，可以更好地沉淀大量的知識(shí)，幫助我們更準(zhǔn)確地探索AI與機(jī)器學(xué)習(xí)的邊界。

在全面數(shù)字化遷徙之旅中，我們獲得信息的渠道和服務(wù)方式也變得越來越便捷智能，對于瀏覽器行業(yè)來說，讓人們以優(yōu)質(zhì)的體驗(yàn)零門檻獲取價(jià)值信息是核心訴求，基于這個(gè)變化與訴求，QQ 瀏覽器也將自己的技術(shù)品牌升級為QQ 瀏覽器實(shí)驗(yàn)室以更好地聚焦服務(wù)用戶。

QQ瀏覽器實(shí)驗(yàn)室：走向下一代信息交互

對于下一代信息的交互平臺(tái)，每個(gè)人心目中的瀏覽器都不一樣，我們可能會(huì)借助元宇宙的技術(shù)，通過手勢、眼神甚至是意識(shí)來操控搜索與推薦，當(dāng)我們進(jìn)入沉浸式的新搜索界面時(shí)，可能很多的邊界都會(huì)模糊甚至消失，比如消費(fèi)和應(yīng)用的邊界，體驗(yàn)與內(nèi)容的邊界，體驗(yàn)與創(chuàng)作的邊界等，可能搜索就是一個(gè)創(chuàng)作的引子，發(fā)現(xiàn)就是探索開始的價(jià)值，用戶與內(nèi)容與應(yīng)用開始層層遞進(jìn)深入，體驗(yàn)和交互的方式全面融合。

無論是哪種未來瀏覽器，本質(zhì)上都是搜索網(wǎng)羅信息，精準(zhǔn)推薦價(jià)值內(nèi)容，這也是信息技術(shù)發(fā)展過程中的不變內(nèi)核。無論未來信息交互的前景怎么變化，前提是技術(shù)的不斷更迭、突破才能帶來體驗(yàn)的重構(gòu)。

在AI與信息交互之間：QQ 瀏覽器的邊界探索

（左起：騰訊副總裁郄小虎、信息平臺(tái)與服務(wù)線CTO徐羽、騰訊副總裁殷宇）

QQ瀏覽器瞄準(zhǔn)長線的數(shù)字化趨勢價(jià)值，成立“QQ瀏覽器實(shí)驗(yàn)室”技術(shù)品牌，依靠AI、搜索、大數(shù)據(jù)、推薦算法的技術(shù)研究，提升信息與服務(wù)的獲取效率，幫助用戶零門檻地獲取價(jià)值信息和服務(wù)，革新用戶與世界的交互方式。

近些年來，我們發(fā)現(xiàn)騰訊越來越重視AI技術(shù)能力的構(gòu)建，也成立了一些技術(shù)品牌，比如TEG（技術(shù)工程事業(yè)群）和CSIG（云與智慧產(chǎn)業(yè)事業(yè)群），這也是大家心目中離技術(shù)最近的品牌。以內(nèi)容為主的PCG并沒有得到足夠的關(guān)注。隨著PCG技術(shù)中臺(tái)的成立，推薦AI中臺(tái)也成為騰訊技術(shù)平臺(tái)中的核心中臺(tái)，而QQ瀏覽器實(shí)驗(yàn)室是PCG技術(shù)中臺(tái)的核心支撐中臺(tái)模塊之一，不斷為騰訊的推薦業(yè)務(wù)賦能。

實(shí)驗(yàn)室是創(chuàng)新不斷誕生并生根發(fā)芽的地方，搜狗搜索團(tuán)隊(duì)并入后，全網(wǎng)搜索的技術(shù)能力與騰訊垂直搜索的能力形成互補(bǔ)，強(qiáng)強(qiáng)聯(lián)手，這個(gè)實(shí)驗(yàn)室就聚合了信息交互中最核心的兩個(gè)技術(shù)，可能是我們邁入未來沉浸式搜索交互的第一步。

在AI與信息交互之間：QQ 瀏覽器的邊界探索

我們知道，信息技術(shù)交互平臺(tái)的發(fā)展不斷進(jìn)階的目標(biāo)就是消除鴻溝與隔閡，縮短人與人、人與信息的距離。騰訊信息平臺(tái)與服務(wù)線CTO徐羽也公開表示QQ 瀏覽器的進(jìn)階目標(biāo)，與之相似都是緊密連接信息與價(jià)值，拓寬用戶了解世界的眼界。打造互聯(lián)網(wǎng)未來30年的信息服務(wù)工具，做技術(shù)的擺渡人，讓價(jià)值信息更好地網(wǎng)羅服務(wù)生活，成為探索未知的下一代超級窗口。

人類歷史的長河中，隨著信息技術(shù)的不斷更迭，會(huì)越來越注重信息與價(jià)值的準(zhǔn)確與高效，這也就意味著推薦系統(tǒng)是個(gè)無限增長且沒有最優(yōu)解的技術(shù)體系，不斷進(jìn)化是它的特點(diǎn)，因此理解用戶的能力也會(huì)不斷地深入，這樣持續(xù)洞察探索推薦的新趨勢和方向，會(huì)為用戶帶來新一代的交互體驗(yàn)與價(jià)值賦能。