百度正式公布文心一言,能否與ChatGPT一爭高下? 在等待了一個多月后,百度的文心一言終于正式發(fā)布,只是對于百度來說整個發(fā)布會過程多少有點“煎熬”,現(xiàn)場沒有進行實機測試,而是用一段視頻來展示文心一言的功能" />
訂閱
糾錯
加入自媒體

百度文心一言體驗:不夠完美,但在ChatGPT面前已展現(xiàn)威力

2023-03-20 17:19
雷科技
關(guān)注

百度正式公布文心一言,能否與ChatGPT一爭高下?

在等待了一個多月后,百度的文心一言終于正式發(fā)布,只是對于百度來說整個發(fā)布會過程多少有點“煎熬”,現(xiàn)場沒有進行實機測試,而是用一段視頻來展示文心一言的功能。

百度似乎對文心一言的表現(xiàn)有些忐忑,甚至從李彥宏的演講過程來看,這位中國互聯(lián)網(wǎng)的傳奇人物,竟然有點緊張。對于百度來說,文心一言的重要性不言而喻,甚至有人將其看做是中國互聯(lián)網(wǎng)對抗ChatGPT的唯一希望,而在過去的一個月里,已經(jīng)有眾多企業(yè)宣布與文心一言合作,進軍未來的人工智能行業(yè)。

氣氛烘托到這個程度,文心一言的具體表現(xiàn)將會直接影響投資者以及用戶對百度的信心。

9d80-d8e290ae252c380d2142381c71f1a21c.jpg

圖源:文心一言發(fā)布會

果不其然,從發(fā)布會上用視頻代替實機演示的時間點開始,百度的股價就開始暴跌,僅10分鐘的跌幅就達到10%,240億元的市值就此蒸發(fā),換算一下,每過一秒百度就損失四千萬元市值。

不過,就像過去很多大企業(yè)在發(fā)布新品時的遭遇一樣,百度的股價同樣坐上了“過山車”,16日暴跌,17號暴漲,百度的股價甚至高于16號的最高值。

百度的市值忽起忽落,不知道李彥宏的心情是否也一樣跟著上下顛簸。不過,至少在發(fā)布會現(xiàn)場,李彥宏也承認,現(xiàn)如今的文心一言還有很多不完美的地方,但是未來將會變得更好,用一句網(wǎng)友熟悉的話來形容:未來可期。

文心一言的表現(xiàn)到底如何?

文心一言,會畫畫?

在正式發(fā)布前,百度就已經(jīng)對外宣傳文心一言除了可以提供類似于ChatGPT的對話問答功能外,還支持生成圖片、視頻等功能。不過在測試中,內(nèi)測版的文心一言似乎并不能提供視頻生成功能,而是直接生成了一段文字。

微信截圖_20230317171426.png

雖然答非所問,但是從文字描述來看,對應(yīng)的視頻畫面倒也是符合我的要求。

對此,李彥宏其實也給出了解釋,視頻功能未上線主要是因為對資源的消耗過大,考慮到整體用戶體驗所以在內(nèi)測版中沒有推出。

視頻功能不行,那么繪畫呢?

我嘗試用不同的描述來讓文心一言生成不同的照片和畫作,不得不說結(jié)果確實出乎我的預料。

這是生成的第一張照片,草原、太陽,基本上符合我的要求,只是太陽似乎少了一個。

微信截圖_20230317172121.png

以畢加索的風格生成一幅油畫呢?

微信截圖_20230317172150.png

我想文心一言恐怕對畢加索風格有“億”點誤解。

試試梵高風格?

微信截圖_20230317172453.png

居然比畢加索的好多了,文心一言難道是個梵高粉絲?

再來看看日系風格。

微信截圖_20230317172226.png

木屋里變成木屋外,遠方還有個雨傘頭怪人,雖然意境上是符合描述,但是BUG也不少。

再來試試科幻風格的,比如機甲大戰(zhàn)怪獸。

微信截圖_20230317173314.png

看著挺不錯的,但是怪獸呢?

微信截圖_20230317173343.png

拿武器的男人、異形都沒有,只有一片農(nóng)田。

在嘗試用不停的話術(shù)來生成照片后,可以看出文心一言的繪畫功能處于一個不穩(wěn)定的狀態(tài),即使是類似的描述,也有可能因為描述內(nèi)容而出現(xiàn)差別極大的結(jié)果,可以是大致符合的,也可以是背道而馳的。

至少從測試結(jié)果來看,雖然文心一言的繪畫照片生成速度和質(zhì)量都很不錯,但是在對用戶語義和內(nèi)容的理解上,顯然是存在一定的問題,后續(xù)還有著很大的優(yōu)化空間。

對話文心一言

對比繪畫功能,對話式問答或許才是大多數(shù)人需要的功能,百度或許是把更多的精力用在對話功能的優(yōu)化上了?那么就讓我們看看,文心一言在對話式問答上的表現(xiàn)如何。

我首先嘗試著讓文心一言評價一下2023年的春節(jié)檔電影《流浪地球2》。

微信截圖_20230317174846.png

單看評價內(nèi)容確實可圈可點,但是注意看第一行回復,“該片于2020年春節(jié)期間上映”,《流浪地球》是2019年的春節(jié)檔電影,《流浪地球2》則是2023年的春節(jié)檔,不管是1還是2顯然都與2020年搭不上邊,邏輯上的錯誤使得這個回復的評分大打折扣。

如果我們指出回答的錯誤會怎樣呢?

微信截圖_20230317175140.png

得,直接變成未上映了。

換一種方式提問會怎樣?

微信截圖_20230317175631.png

我們得到了一個前后矛盾的回答。

實話說,就現(xiàn)在的表現(xiàn)來看,文心一言即使在常識性的問答上都有不少的錯誤,甚至會在一個回答中給出完全相反的觀點。

特別是涉及到具體時間的問題回答上,文心一言似乎有嚴重的BUG。

再來試試腦筋急轉(zhuǎn)彎。

微信截圖_20230317180424.png

回答不出所料。

有意思的是,在我指出回答中存在的問題后,文心一言居然圓回來了。

微信截圖_20230317180701.png

腦筋急轉(zhuǎn)彎還是有點難度過高,讓我們試試普通的提問。

微信截圖_20230317181152.png

終于回答正確了,不容易啊。

再來測試一下其他應(yīng)用場景。

微信截圖_20230317182332.png

咋看之下,這個回答是沒有問題的,只不過,若是懂行的人看到這份回答, 恐怕會忍不住笑出聲。比如,銳龍9 6900HX確實是一顆高性能處理器,而RX 5800XM則是一個不存在的產(chǎn)品,即使有也是AMD的顯卡產(chǎn)品而非處理器。

再來看顯卡推薦,RTX 2060是正確的,但是Intel iGPU就多少讓人摸不著頭腦了,Intel自己估計都不知道還有這樣的東西,下面的內(nèi)存、硬盤兩項回答上同樣有不少問題。

讓我們換個領(lǐng)域試試。

微信截圖_20230317184246.png

看來在生活領(lǐng)域的問答中,文心一言的準確度要高很多。

換個方式問,同樣回答正確。

微信截圖_20230317184530.png

再來上點難度。

微信截圖_20230317184657.png

雖然去兩遍長城有點讓人摸不著頭腦,但是從計劃來看,并沒有太大的問題,完全是一個可實現(xiàn)的簡略旅游計劃。

那么能否生成一個詳細一點的旅游計劃呢?

微信截圖_20230317185201.png

可以說,如果你想來一趟短暫的廣州旅行,但是卻不知道去哪里,按照這份攻略來走基本上不會出錯,文心一言在生活問答方面的表現(xiàn)遠遠超出了我的預料。

雖然在涉及到文藝作品、數(shù)碼等領(lǐng)域的問答存在許多問題,但是在使用率最高的生活問答中,文心一言的表現(xiàn)已然合格,結(jié)合手機端的APP定位和用戶人像,可以提供更準確、詳細的建議。

至少在旅游娛樂方面,文心一言已經(jīng)展示出很大的潛力。

文心一言,可以成為生產(chǎn)力工具嗎?

在此之前,我們聊到ChatGPT,除了驚嘆于強大的對話式問答功能,其在生產(chǎn)力方面的表現(xiàn)也讓許多人產(chǎn)生了危機感,甚至有聲音認為,ChatGPT將會取代許多工作,導致失業(yè)危機。

那么,文心一言作為同類型的人工智能產(chǎn)品,在生產(chǎn)力方面的表現(xiàn)又如何呢?

首先來一篇簡單的廣州風土人情介紹文章。

微信截圖_20230317194545.png

額,好像被我玩壞了。

微信截圖_20230317194811.png

在刪去字數(shù)要求后,文心一言給出了正常的回答。

換個條件再試試。

微信截圖_20230317195215.png

還是正常的。

讓我們繼續(xù)測試。

微信截圖_20230317195250.png

額,看樣子“500字”似乎是文心一言的死穴,隨后我對500字進行了一些微調(diào),但是給出的回答都是正常的,恐怕這里存在一個未知的BUG,有待后續(xù)百度的工程師進行修復。

拋開意外觸發(fā)的BUG不談,文心一言確實可以生成簡單的文案,可以為使用者提供一個基本的內(nèi)容框架,只需要進行內(nèi)容填充就可以成為一篇簡單直白的介紹文。當然要求不高的話,直接復制粘貼使用也是可以的,在生產(chǎn)力方面,文心一言的表現(xiàn)并不如生活領(lǐng)域的表現(xiàn)突出,甚至可以說有些稀疏平常。

3d282d931fcb4fc888383756a8a497d2.jpeg

圖源:文心一言發(fā)布會

不過,考慮到目前文心一言還是初始內(nèi)測版本,后續(xù)的優(yōu)化空間還是很大的。綜合體驗下來,文心一言給我的感受既有驚喜也有“驚嚇”,雖然在一些專業(yè)性質(zhì)較強的領(lǐng)域上,文心一言有著不少的問題,但是在一些重點優(yōu)化的領(lǐng)域,如生活娛樂,可以看到文心一言的回答已經(jīng)有了不錯的表現(xiàn)。

在生活娛樂領(lǐng)域表現(xiàn)出來的潛力,或許就是百度在發(fā)布文心一言后,第二天股價暴漲的原因,雖然在生產(chǎn)力等方面的表現(xiàn)不如人意,但是卻已經(jīng)表現(xiàn)出了驚人的潛力。

對于文心一言的未來,個人是十分看好的。

    來源:雷科技

           原文標題 : 百度文心一言體驗:不夠完美,但在ChatGPT面前已展現(xiàn)威力

    聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

    發(fā)表評論

    0條評論,0人參與

    請輸入評論內(nèi)容...

    請輸入評論/評論長度6~500個字

    您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

    暫無評論

    暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號