訂閱
糾錯(cuò)
加入自媒體

用上大模型的「直答」,能讓知乎答案更靠譜嗎?

2024-07-02 09:03
雷科技
關(guān)注

還不完善,但真的有用。

如果說(shuō) 2023 年,AI 大模型給所有人都帶來(lái)了一種前所未有的震撼,那么到了 2024 年,這種震撼毫無(wú)意外地有所削弱,AI 大模型競(jìng)爭(zhēng)的核心焦點(diǎn)已經(jīng)轉(zhuǎn)移到了落地的應(yīng)用上:

得讓更多人真正地用起來(lái)。

在前幾天舉辦的 2024 知乎第十屆鹽 Club 新知青年大會(huì)上,知乎正式發(fā)布了一款新的 AI 大模型產(chǎn)品「知乎直答」,底層基于知乎自主訓(xùn)練的「知海圖 AI」大模型。

不過(guò)嚴(yán)格來(lái)說(shuō),「知乎直答」并不新。

早在今年 3 月舉辦的 2024 知乎發(fā)現(xiàn)大會(huì)上,知乎其實(shí)就發(fā)布了 AI 功能「發(fā)現(xiàn)·AI 搜索」。在官方表述中,「發(fā)現(xiàn)·AI 搜索」是以社區(qū)可信賴內(nèi)容為來(lái)源,給用戶帶來(lái)集新搜索、實(shí)時(shí)問(wèn)答和追問(wèn)功能于一體的全新體驗(yàn)。

這個(gè)表述基本可以套用在「知乎直答」上,區(qū)別在于從「以社區(qū)可信賴內(nèi)容為來(lái)源」轉(zhuǎn)變到了「以知乎社區(qū)的優(yōu)質(zhì)內(nèi)容為核心,多種數(shù)據(jù)源為輔助」,還從依附知乎的一個(gè)功能正式升級(jí)為一個(gè)擁有獨(dú)立域名(zhida.ai)的獨(dú)立產(chǎn)品。

但對(duì)于普通用戶,更關(guān)心的問(wèn)題可能還是:作為一款 AI 大模型產(chǎn)品,「知乎直答」真的可以如官方所言,「為大家提供一種全新的獲取可靠信息的途徑」嗎?以及比起其他類似的 AI 搜索產(chǎn)品,以知乎社區(qū)內(nèi)容為核心的「知乎直答」又有什么優(yōu)勢(shì)?

一切都要「實(shí)踐出真知」。

“AI 搜索”只是皮囊,知乎內(nèi)容才是靈魂

「知乎直答」的產(chǎn)品設(shè)計(jì)非常簡(jiǎn)單,也非常熟悉,一言以蔽之就是——類 Perplexity 的 AI 搜索設(shè)計(jì)。國(guó)內(nèi)外很多 AI 搜索產(chǎn)品也都采用了這一設(shè)計(jì),原因倒也不復(fù)雜:好用,也夠用。

SCR-20240701-ndvc.png

圖/雷科技

進(jìn)入主頁(yè),正中間是最核心的提問(wèn)框,下方是問(wèn)題推薦欄,作為初上手用戶的一種引導(dǎo)以及提高用戶粘性的一種策略,側(cè)欄則是問(wèn)答列表和用戶設(shè)置。

輸入問(wèn)題后,「知乎直答」同樣也是經(jīng)過(guò)「理解問(wèn)題」「查找信息」,才能「生成回答」「完成回答」。完成回答后,除了能看到最終呈現(xiàn)的回答內(nèi)容,你還可以看到前置的「參考來(lái)源」。

SCR-20240701-ndme.png

圖/雷科技

與此同時(shí),你還可以繼續(xù)「深入」,追問(wèn) AI 一些問(wèn)題,比如在 iPhone 16 計(jì)劃引入不銹鋼電池外殼這個(gè)問(wèn)題下,小雷繼續(xù)追問(wèn)「其他廠商會(huì)用嗎?」AI 可以聯(lián)系上下文進(jìn)行理解,不需要重復(fù)提及「不銹鋼電池外殼」。

SCR-20240701-rdxh.png

圖/雷科技

此外除了默認(rèn)的「深入」模式,用戶還能選擇「簡(jiǎn)略」模式進(jìn)行提問(wèn),顧名思義就是每次輸出更少字?jǐn)?shù)的回答。

而這些,也就基本構(gòu)成了「知乎直答」的「皮囊」。坦白講,談不上什么驚喜,但也算得上現(xiàn)階段比較成熟的設(shè)計(jì),只是有些細(xì)節(jié)需要打磨,比如在追問(wèn)中選擇回答模式時(shí),選項(xiàng)窗口的彈出位置等。

不過(guò)正所謂,「好看的皮囊千篇一律,有趣的靈魂萬(wàn)里挑一!

「知乎直答」最核心的競(jìng)爭(zhēng)力都來(lái)自知乎的海量回答,這既是中文互聯(lián)網(wǎng)最高質(zhì)量、最重要的語(yǔ)料庫(kù)之一,也是一個(gè)實(shí)時(shí)更新、匯集無(wú)數(shù)用戶問(wèn)答的數(shù)據(jù)庫(kù)。

簡(jiǎn)而言之,在預(yù)訓(xùn)練大模型的階段,「知海圖 AI」大模型就將高質(zhì)量的知乎問(wèn)答作為核心語(yǔ)料進(jìn)行訓(xùn)練;而在「知乎直答」的落地應(yīng)用上,也將知乎作為核心數(shù)據(jù)庫(kù)用來(lái)「查找信息」,最終基于此「生成回答」。

但說(shuō)歸說(shuō),最終還是要見(jiàn)真招的。

用上AI大模型,知乎答案會(huì)更靠譜嗎?

眾所周知,AI 大模型最強(qiáng)大的能力之一是對(duì)自然語(yǔ)言的理解,AI 搜索對(duì)比傳統(tǒng)搜索最大的一個(gè)優(yōu)勢(shì)也是能夠更準(zhǔn)確地理解用戶意圖。

從「理解問(wèn)題」的角度,「知乎直答」確實(shí)在一定程度上體現(xiàn)出了 AI 大模型的優(yōu)勢(shì)。比如詢問(wèn)「你和秘塔 AI 搜索之間有什么區(qū)別」,能夠理解我是在問(wèn)「知乎直答」和「秘塔 AI 搜索」之間的區(qū)別,并從功能定位、技術(shù)特點(diǎn)、用戶交互等角度進(jìn)行對(duì)比。

SCR-20240701-rehz.png

圖/雷科技

就是祭出中文十級(jí)考題,讓「知乎直答」理解下「人要是行,干一行行一行,一行行行行行,行行行干哪行都行。要是不行,干一行不行一行,一行不行行行不行,行行不行干哪行都不行」,也能準(zhǔn)確理解語(yǔ)義。

SCR-20240701-rerq.png

圖/雷科技

此外,「知乎直答」也能根據(jù)語(yǔ)境進(jìn)行理解,還了解一些垂直領(lǐng)域的專用名詞,比如詢問(wèn)「詹姆斯是 NBA 的 GOAT 嗎」,能明白是指勒布朗·詹姆斯(LeBron James),也明白 GOAT 在此處代表 NBA 歷史上最偉大的球員。

SCR-20240701-revq.png

圖/雷科技

不過(guò)「知乎直答」在時(shí)間判斷上似乎存在一些問(wèn)題。比如詢問(wèn)五年前能準(zhǔn)確推導(dǎo)到 2019 年,問(wèn)十年前卻直接推導(dǎo)到了 2012 年(應(yīng)該是 2014 年)。

 

SCR-20240701-rfdl.png

圖/雷科技

另外從參考來(lái)源來(lái)看,「知乎直答」的邏輯也可能存在問(wèn)題,在「查找信息」過(guò)程中更多是以「十年前」,而非「2012 年」或者「2014 年」為關(guān)鍵詞進(jìn)行查找。

這也引出了「知乎直答」在理解問(wèn)題后的下一步:查找信息。

相比其他 AI 大模型產(chǎn)品,AI 搜索在技術(shù)上最核心的區(qū)別是基于 RAG (檢索增強(qiáng)生成)技術(shù)和實(shí)時(shí)聯(lián)網(wǎng)生成回答,除了檢索能力,另一個(gè)影響大模型生成質(zhì)量的關(guān)鍵因素是數(shù)據(jù)庫(kù)。

而相比其他 AI 搜索,知乎恰恰擁有一個(gè)得天獨(dú)厚的優(yōu)勢(shì)——可能是中文世界最優(yōu)質(zhì)的站內(nèi)內(nèi)容,同時(shí)在從「發(fā)現(xiàn)·AI 搜索」功能升級(jí)到「知乎直答」產(chǎn)品的過(guò)程中,知乎沒(méi)有局限于站內(nèi)內(nèi)容,而是擴(kuò)大到了全網(wǎng)的可檢索內(nèi)容。

比如在「C919 國(guó)產(chǎn)大飛機(jī)目前處于什么水準(zhǔn)」的問(wèn)題中,「知乎直答」除了找到站內(nèi)的一些回答,還查閱到了不少來(lái)自媒體報(bào)道的內(nèi)容,包括百度百科、澎湃新聞、政府網(wǎng)站、新華社等網(wǎng)站來(lái)源。

SCR-20240701-rfnr.png

圖/雷科技

不過(guò)當(dāng)我們使用「知乎直答」的時(shí)候,首先會(huì)有一個(gè)很多人關(guān)心的問(wèn)題:「知乎直答」真的能用上知乎的回答嗎?

最簡(jiǎn)單的回答是:用上了,而且真的做到了可追溯。

以蘋(píng)果計(jì)劃引入不銹鋼電池外殼的問(wèn)題為例,「知乎直答」第一個(gè)回答的質(zhì)量倒并未讓小雷很驚喜,包括電池能量密度的普遍提高,以及歐盟政策的影響都沒(méi)有被提及。

但「知乎直答」還是從七個(gè)方面回答了蘋(píng)果引入不銹鋼外殼電池的理由,同時(shí)在一些地方直接標(biāo)示了引用來(lái)源,絕大部分都是來(lái)自知乎站內(nèi)的回答,只有 13、15 兩個(gè)來(lái)源是站外媒體報(bào)道。

SCR-20240701-nicj.png

圖/雷科技

點(diǎn)擊這些引用鏈接,也確實(shí)能夠看到相對(duì)應(yīng)的信息和觀點(diǎn)來(lái)源。不過(guò)需要注意的是,引用也只是部分引用,比如在「維修友好」的部分,引用來(lái)源只提到了前半句的「不銹鋼電池外殼的設(shè)計(jì)可能便于維修」。

至于后半句關(guān)于「iOS 維修模式」的內(nèi)容,實(shí)際在引用鏈接中只字未提,更多還是大模型的「創(chuàng)作」。

另外,「知乎直答」雖然號(hào)稱可以利用站內(nèi)的海量?jī)?yōu)質(zhì)內(nèi)容,但實(shí)際不同問(wèn)題下可以利用的站內(nèi)內(nèi)容質(zhì)量參差不齊,有些問(wèn)答本身的質(zhì)量就比較低,甚至回答干脆就是由 AI 生成的。

這可能也是知乎選擇將檢索范圍從站內(nèi)擴(kuò)大全網(wǎng)的主要原因之一。

但無(wú)論如何,「知乎直答」最終都是要「生成回答」的。在這一點(diǎn)上,得益于站內(nèi)的優(yōu)質(zhì)內(nèi)容,「知乎直答」確實(shí)在一些領(lǐng)域中表現(xiàn)得比較專業(yè),回答的內(nèi)容更加切實(shí),而不是空洞。

以 C919 的問(wèn)題為例,「秘塔 AI 搜索」的回答比較離題,結(jié)論也很寬泛。

SCR-20240701-rglz.png

秘塔 AI 搜索的回答,圖/雷科技

同樣的問(wèn)題在「知乎直答」這邊則有更高質(zhì)量的回答,相關(guān)的信息和觀點(diǎn)都稱得上言之有物,能夠幫助用戶更好地理解 C919 的定位、競(jìng)爭(zhēng)力以及意義。

SCR-20240701-rgtp.png

知乎直答的回答,圖/雷科技

此外在「五年前大家對(duì) 5G 都是什么看法」的問(wèn)題中,「知乎直答」在開(kāi)頭就回答道,「五年前,即 2019 年,人們對(duì) 5G 的看法是多元化的,既充滿了期待也伴隨著一些質(zhì)疑!怪笳归_(kāi)的觀點(diǎn),也確實(shí)反映了當(dāng)時(shí)中文互聯(lián)網(wǎng)上對(duì)于 5G 的不同觀點(diǎn)。

SCR-20240701-rjwr.png

圖/雷科技

不過(guò)一些問(wèn)題上,小雷也發(fā)現(xiàn)了「知乎直答」的一些不足。

比如詢問(wèn)「姚明加入 NBA 的時(shí)候,NBA 亞軍隊(duì)的教練是誰(shuí)」,可以看到「知乎直答」知道了姚明加入 NBA 是在 2002 年,但表示「沒(méi)有直接信息表明姚明加入 NBA 那一年的亞軍隊(duì)教練是誰(shuí)」。

但如果繼續(xù)追問(wèn)「所以 2002 年 NBA 亞軍隊(duì)的教練是誰(shuí)」,「知乎直答」可以給出正確的推導(dǎo)過(guò)程和答案——新澤西網(wǎng)隊(duì)(現(xiàn)布魯克林籃網(wǎng)隊(duì))時(shí)任主教練拜倫·斯科特(Byron Scott)。

SCR-20240701-rhbx.png

圖/雷科技

換言之,「知乎直答」完全是有能力直接給出正確答案的,但不知道受限于什么因素,需要用戶繼續(xù)追問(wèn)才能給出最終回答。

還有在不銹鋼電池外殼問(wèn)題的追問(wèn)中,隨著追問(wèn)輪次的增加也會(huì)影響「知乎直答」的上下文理解能力,比如在第五輪的追問(wèn),直接詢問(wèn)「換用不銹鋼外殼會(huì)有哪些變化」,AI 似乎忘掉了之前都是以手機(jī)電池為核心。

SCR-20240701-rhow.png

圖/雷科技

而在第六輪的追問(wèn)中,小雷重新提到了「手機(jī)電池」,AI 倒是也能重回正軌,基于手機(jī)電池進(jìn)行回答。

簡(jiǎn)單來(lái)說(shuō),「知乎直答」在剛開(kāi)始能夠較輕松地結(jié)合上下文理解新的問(wèn)題,但隨著上下文長(zhǎng)度的拉長(zhǎng),這種理解能力可能會(huì)有明顯地下降。

寫(xiě)在最后

總的來(lái)說(shuō),在一眾 AI 大模型產(chǎn)品之中,「知乎直答」確實(shí)找到了一些差異化的定位,基于站內(nèi)的優(yōu)質(zhì)內(nèi)容,提供更高信息量、更能追溯來(lái)源的回答。

不過(guò)問(wèn)題也還存在,有些可以通過(guò)一些技巧解決,比如最好明確時(shí)間而非使用「X 年前」作為輸入詞,多輪問(wèn)答可以適當(dāng)強(qiáng)調(diào)下關(guān)鍵詞等;有些還是需要基礎(chǔ)大模型以及技術(shù)上改進(jìn),比如模型對(duì)用戶意圖更深層的理解,參考來(lái)源的權(quán)重排序或者篩選等。

就現(xiàn)在來(lái)說(shuō),如果我知道一些領(lǐng)域和話題已經(jīng)在知乎有了精彩的討論,確實(shí)會(huì)更愿意使用「知乎直答」快速、便捷地進(jìn)行了解和深入。

但會(huì)不會(huì)更大程度地使用「知乎直答」作為日常獲取信息和觀點(diǎn)的渠道呢?還是要看后續(xù)模型和產(chǎn)品的改進(jìn),我相信還是很有希望的,就像知乎直答官方號(hào)在一個(gè)關(guān)于「知乎直答」的問(wèn)題中答到:

AI 時(shí)代才剛剛開(kāi)始,前面的路還很長(zhǎng)。

來(lái)源:雷科技

       原文標(biāo)題 : 用上大模型的「直答」,能讓知乎答案更靠譜嗎?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)