訂閱
糾錯(cuò)
加入自媒體

今天,你“文生圖”了嗎?

2022-11-25 10:09
知頓
關(guān)注

最近一段時(shí)間,“文生圖”異;鸨,或者叫AI繪畫、AI作畫,其實(shí)叫什么不重要的,重要的是本質(zhì),就是這一新技術(shù)究竟會(huì)給社會(huì)帶來(lái)怎樣的影響或顛覆。

隨著一幅幅精美的“文生圖”繪畫作品出現(xiàn)在網(wǎng)絡(luò)空間,抖音開(kāi)始出現(xiàn)各種教授網(wǎng)友制作文生圖的視頻教程,而在小紅書(shū)和閑魚(yú)上甚至還出現(xiàn)了賣AI壁紙、AI文生圖描述語(yǔ)句的職業(yè)。

簡(jiǎn)單來(lái)說(shuō),文生圖,就是輸入一些描述語(yǔ)句,AI可以為你生成創(chuàng)意畫作,這是當(dāng)下AI最火熱的應(yīng)用領(lǐng)域之一——AI作畫。其實(shí)也是AIGC的一種。最近幾年,AI寫作、AI作曲,AI在內(nèi)容創(chuàng)作方面的應(yīng)用可謂越來(lái)越廣泛了。

今天,你“文生圖”了嗎?

對(duì)于“文生圖”這樣一個(gè)新事物,無(wú)論是百度、谷歌這樣的互聯(lián)網(wǎng)大廠,還是新銳創(chuàng)業(yè)公司都已入局。

最近,百度旗下的AI藝術(shù)和創(chuàng)意輔助平臺(tái)——文心一格的發(fā)布引起比較大的關(guān)注。畢竟以人工智能技術(shù)驅(qū)動(dòng)發(fā)展的百度,此前已經(jīng)在搜索引擎、自動(dòng)駕駛、數(shù)字人、AI語(yǔ)音交互等領(lǐng)域取得了不俗的成績(jī),在AI作畫領(lǐng)域,百度的“文心一格”也備受期待!

文生圖作畫效果怎么樣?

文生圖效果好不好,先來(lái)上一組圖,大家自己看。

今天,你“文生圖”了嗎?

我也親測(cè)了一下,整體效果還不錯(cuò)!

比如輸入“晴朗夏日竹林里的少年”,生成了這樣一幅圖!

今天,你“文生圖”了嗎?

基本符合預(yù)期。

輸入“古風(fēng)美男,長(zhǎng)發(fā)飄飄”,選擇動(dòng)漫風(fēng)格。就出現(xiàn)了下面這張圖。

今天,你“文生圖”了嗎?

用這張圖片用來(lái)給一篇分析二次元、國(guó)漫方面話題的文章配圖肯定是ok的。

今天,你“文生圖”了嗎?

輸入“深秋,陽(yáng)光下的小女孩”;究捎谩.(dāng)然也有不足的地方。比如手部細(xì)節(jié)不夠完美。這幾乎是目前所有“文生圖”平臺(tái)的通病,就是臉部細(xì)節(jié)和手部細(xì)節(jié)的呈現(xiàn)不夠完美。需要平臺(tái)提供就文生圖畫作局部調(diào)整的功能。比如圈定要修改區(qū)域,輸入描述,然后進(jìn)一步優(yōu)化,就能輸出調(diào)整后的結(jié)果。估計(jì),這將是“文心一格”下一步要上線的功能。

再輸入“深秋一位打太極拳男子的背影”,出來(lái)的圖片,背影不完整。

然后輸入“天空中的一條龍”,出來(lái)的龍并不是我想要的中國(guó)龍,重新調(diào)整詞匯,輸入“云層中一條咆哮的中國(guó)龍”就得到了想要的結(jié)果。

嘗試下來(lái),整體感覺(jué),輸入一句話比輸入幾個(gè)詞匯結(jié)果更令人滿意,描述字句越詳細(xì),畫面細(xì)節(jié)也越豐富。

時(shí)間方面,“文心一格”顯示“請(qǐng)等待2分鐘”,但是通常是幾十秒,就能得到四種結(jié)果,供用戶選擇。

之前使用過(guò)Stable Diffusion的AI做圖,由于只支持英文交互,所以對(duì)于英文一般的我而言,還是比較限制表達(dá)。雖然現(xiàn)在有各種翻譯軟件,但是還是比較麻煩。百度的“文心一格”無(wú)疑更適合中國(guó)用戶。

不難看出,“文生圖”技術(shù),對(duì)中文語(yǔ)義的理解尤為關(guān)鍵。對(duì)于設(shè)計(jì)師而言,能準(zhǔn)確理解客戶需求就能交付好的作品讓客戶滿意。對(duì)于AI作畫同樣存在這個(gè)問(wèn)題。這一點(diǎn)“文心一格”還是比較優(yōu)秀的。

比如輸入“草原上奔跑的寶馬”,究竟是什么馬?究竟是汽車寶馬,還是一匹駿馬?輸入“佛跳墻”會(huì)出現(xiàn)什么樣的內(nèi)容?是一尊佛從墻上跳下來(lái),還是佛跳墻這道菜?對(duì)比一下文心一格與其他文生圖平臺(tái)的結(jié)果,“文心一格”顯然對(duì)中國(guó)文化的理解更精準(zhǔn)。

今天,你“文生圖”了嗎?

如何做到對(duì)需求的準(zhǔn)確理解?

在我看來(lái),對(duì)需求的準(zhǔn)確理解,應(yīng)該是“文生圖”這項(xiàng)技術(shù)最重要的能力。那么,如何做好這一點(diǎn)?

百度技術(shù)中臺(tái)事業(yè)群市場(chǎng)部負(fù)責(zé)人張全文提到了一個(gè)關(guān)鍵詞——大模型。

張全文介紹:“文心一格”“AI作圖”產(chǎn)品順利落地,是百度依托于飛槳、文心大模型持續(xù)進(jìn)行技術(shù)創(chuàng)新的結(jié)果。百度的文心跨模態(tài)大模型ERNIE-ViLG 2.0是全球首個(gè)知識(shí)增強(qiáng)的AI作畫大模型,也是目前全球參數(shù)規(guī)模最大的AI作畫大模型。近年來(lái)以深度學(xué)習(xí)為代表的算法發(fā)展,以及數(shù)據(jù)量井噴式增長(zhǎng),讓百度在訓(xùn)練大模型方面取得了長(zhǎng)足的進(jìn)步。

所謂大模型,就是讓算法在大規(guī)模、海量的、沒(méi)有標(biāo)注的、無(wú)規(guī)律的數(shù)據(jù)里面進(jìn)行自我學(xué)習(xí),挖掘規(guī)律,進(jìn)而生成一個(gè)基礎(chǔ)的模型。之后在這個(gè)基礎(chǔ)的模型之上,結(jié)合各個(gè)領(lǐng)域的少量的任務(wù)數(shù)據(jù),再進(jìn)行訓(xùn)練、調(diào)優(yōu),之后就可以適用很多場(chǎng)景。

今年7月,百度用大模型復(fù)原了元代畫家黃公望的傳世畫作《富春山居圖》。這幅畫作在之前被火焚燒,分成了兩段,2011年前后半卷首次在臺(tái)北故宮博物院展出。百度的工程師,運(yùn)用AI大模型技術(shù)去學(xué)習(xí)原畫做的筆觸和風(fēng)格,并邀請(qǐng)普通用戶借助百度的技術(shù),按照心中所想來(lái)補(bǔ)全該畫作。不同的人呈現(xiàn)出不同的《富春山居圖》,每一幅畫作卻都那么和諧,不禁令人驚嘆AI技術(shù)之妙用。

在科技想象力不斷破圈的今天,AI作畫正處在高速發(fā)展的黃金階段。相信,不久之后這項(xiàng)能力就會(huì)成為用戶日常獲得圖像內(nèi)容的基礎(chǔ)選項(xiàng),完全融入我們的生活與工作之中。

除了AI作畫之外,文心大模型投入產(chǎn)業(yè)應(yīng)用,服務(wù)千行百業(yè)的節(jié)奏應(yīng)該也是非?斓。

據(jù)張全文介紹,文心大模型具有兩大核心特色,一是知識(shí)增強(qiáng),二是產(chǎn)業(yè)級(jí)。得益于兩大特色,文心大模型通用性好、泛化性強(qiáng),作為人工智能“基礎(chǔ)設(shè)施”的一部分,進(jìn)一步拓寬了人工智能技術(shù)落地的場(chǎng)景覆蓋廣度,更加深了產(chǎn)業(yè)應(yīng)用的深度。

目前,文心大模型已大規(guī)模應(yīng)用于搜索、信息流、智能音箱等互聯(lián)網(wǎng)產(chǎn)品,并已通過(guò)飛槳開(kāi)源開(kāi)放平臺(tái)、百度智能云等賦能到工業(yè)、能源、金融、通信、媒體、教育等各行各業(yè)。

幫助有圖片需求的人“降本增效”

有了文生圖以后,作為從事自媒體工作的我來(lái)說(shuō),還是非常開(kāi)心的。畢竟對(duì)于自媒體創(chuàng)業(yè)者來(lái)說(shuō),只要能“降本增效”的技術(shù)都是要積極擁抱的。

此前為了節(jié)省圖片制作成本,嘗試過(guò)各種大小網(wǎng)站,海報(bào)制作,AI摳圖,照片轉(zhuǎn)漫畫等等。本著節(jié)約設(shè)計(jì)費(fèi)的角度,能省一張是一張。幾年下來(lái),充值了五六個(gè)網(wǎng)站,也沒(méi)能很好的解決這個(gè)問(wèn)題。仍然需要人工設(shè)計(jì)來(lái)完成公眾號(hào)封面制圖工作。文章內(nèi)的配圖,則是盡量少配圖,甚至不配圖,避免侵權(quán)問(wèn)題。

熟悉知頓公號(hào)的朋友到知道,我們?cè)谝环瑖L試之后,將公號(hào)圖片風(fēng)格確定為漫畫風(fēng)格,目前是真人畫師手繪。好處是有顏值,有識(shí)別度,有一致的風(fēng)格,有自己的版權(quán)。付出的代價(jià)是按照數(shù)量付費(fèi),用得越多,成本越高。

文生圖技術(shù)的出現(xiàn),確實(shí)可以部分替代封面圖設(shè)計(jì)制作問(wèn)題。如果能定制風(fēng)格,或者輸入?yún)⒖硷L(fēng)格的圖片,那么這個(gè)替代作用會(huì)更好用。

目前“文心一格”還處于免費(fèi)階段,即使日后收費(fèi),大概率也是按照會(huì)員收費(fèi),整體成本還是要大大低于設(shè)計(jì)費(fèi)用。

估計(jì)該技術(shù)將在設(shè)計(jì)、繪畫領(lǐng)域率先落地,特別是影視、動(dòng)漫、游戲、漫畫、媒體、廣告、出版、時(shí)尚、媒體等行業(yè),大面積商業(yè)化指日可待。

文生圖會(huì)取代人類畫師嗎?

這么一來(lái),可能很多人要擔(dān)心:“設(shè)計(jì)師、畫師是不是要下崗了!”其實(shí),這個(gè)擔(dān)心不無(wú)道理,但是歷史的車輪永遠(yuǎn)向前滾動(dòng),新技術(shù)的對(duì)傳統(tǒng)領(lǐng)域的解構(gòu)和重塑一直都在發(fā)生。

短期來(lái)看,文生圖是AI輔助創(chuàng)作,還是很難代替設(shè)計(jì)師、畫師的。畢竟真實(shí)世界的需求,很多是目前AI技術(shù)無(wú)法精準(zhǔn)理解和實(shí)現(xiàn)的。積極的一面是,設(shè)計(jì)師、畫師可以借助AI,提高自己創(chuàng)作的效率,甚至激發(fā)無(wú)窮的想象力。畢竟AI從海量數(shù)據(jù)中學(xué)習(xí)到的知識(shí),是靈感得以實(shí)現(xiàn)的基礎(chǔ),人類畫作數(shù)千年的積累和沉淀為AI文生圖提供了可能;AI生成圖像過(guò)程中的隨機(jī)性,是靈感的補(bǔ)充,AI可以學(xué)習(xí)一千種人類繪制山峰的方式,甚至創(chuàng)造出“第一千零一種可能”。

但是,也必須承認(rèn),AI作畫確實(shí)會(huì)給一部分缺少創(chuàng)意能力,設(shè)計(jì)和繪畫水平一般的人帶來(lái)沖擊。

回顧人類發(fā)展歷史,新技術(shù)的出現(xiàn),改變了很多行業(yè)。比如電腦的普及和輸入法的出現(xiàn),讓打字員這個(gè)職業(yè)迅速消失。其實(shí),一些職業(yè)的消失也并不是壞事。比如中國(guó)古代每個(gè)女人都是要學(xué)習(xí)針織刺繡這樣的女工手藝,以滿足一家老小的穿衣需求。即使在我小的時(shí)候,冬天穿的棉衣褲、春秋穿的毛衣毛褲也都是母親手工制作。那時(shí)候有“裁縫”這個(gè)專門的職業(yè),而如今裁縫這個(gè)職業(yè)基本消失了,卻出現(xiàn)了服裝設(shè)計(jì)師。精細(xì)化的分工,讓服裝實(shí)現(xiàn)了工業(yè)化生產(chǎn)和流通,人們隨處都可以買到服裝。

當(dāng)技術(shù)浪潮來(lái)臨之際,做弄潮者,還是被拍死在沙灘上,答案不言而喻。作為繪畫創(chuàng)作者,主動(dòng)去擁抱“文生圖”這樣的新技術(shù)或許是最好的選擇。正如人工智能專家吳軍說(shuō)過(guò)的那樣,“任何一次技術(shù)革命,最初受益的都是發(fā)展它、使用它的人,而遠(yuǎn)離它、拒絕接受它的人,在很長(zhǎng)的時(shí)間里都將是迷茫的一代。”

點(diǎn)燃普通人的繪畫創(chuàng)作熱情

不同于設(shè)計(jì)師和畫師,AI作畫那么對(duì)于普通用戶又意味著什么?

在我看來(lái),更多的是點(diǎn)燃了普通人的創(chuàng)作熱情!

舉個(gè)例子:一位爸爸,通過(guò)文心一格,給女兒做了一個(gè)繪本。講述了他和妻子從學(xué)生時(shí)代相識(shí)、相愛(ài),到結(jié)婚,以及妻子懷孕,給女兒布置房間,女兒長(zhǎng)大成為一名小學(xué)生的過(guò)程。不懂繪畫的爸爸,通過(guò)AI繪畫的方式,配上自己充滿愛(ài)的語(yǔ)言,給孩子親手制作這樣獨(dú)特的記憶繪本。

今天,你“文生圖”了嗎?

今天,你“文生圖”了嗎?

繪畫是一個(gè)需要長(zhǎng)期培養(yǎng),投入一定時(shí)間的技能。每個(gè)人小時(shí)候或多或少都有繪畫創(chuàng)作的熱情,但是,這種熱情往往在漫長(zhǎng)的技法學(xué)習(xí)與練習(xí)中被逐漸磨滅,能堅(jiān)持下來(lái)的畢竟是少數(shù)。AI繪畫可以讓沒(méi)有繪畫基礎(chǔ)的普通人,點(diǎn)燃創(chuàng)作熱情,實(shí)現(xiàn)創(chuàng)作自由。

當(dāng)技術(shù)降低創(chuàng)作的門檻,就會(huì)使得這一領(lǐng)域迅速繁榮起來(lái),就如同生物界的“涌現(xiàn)”。在AI繪畫領(lǐng)域也一定會(huì)出現(xiàn)這樣的“涌現(xiàn)”情況,這大概是這項(xiàng)技術(shù)給普通人帶來(lái)的新機(jī)會(huì)。

關(guān)于AIGC的發(fā)展趨勢(shì),百度CEO李彥宏曾表示,未來(lái)AIGC將走過(guò)三個(gè)發(fā)展階段:“助手階段、協(xié)作階段、原創(chuàng)階段。在第一階段,AIGC將輔助人類進(jìn)行內(nèi)容生產(chǎn);第二階段,AIGC以虛實(shí)并存的虛擬人形態(tài)出現(xiàn),形成人機(jī)共生的局面;第三階段則是原創(chuàng)階段AIGC將獨(dú)立完成內(nèi)容創(chuàng)作。”顯然當(dāng)前我們還處于第一階段。“隨著技術(shù)的突破,AI作畫,AI創(chuàng)作視頻,甚至構(gòu)建整個(gè)虛擬世界可能變得像手機(jī)拍照一樣簡(jiǎn)單!睂(duì)于AI繪畫,我們可以有更多的期待!

如何避免技術(shù)作惡?

每一次新技術(shù)誕生之后,人們總是免不了擔(dān)憂!拔纳鷪D”技術(shù)是否會(huì)也被濫用,坦白說(shuō),很難完全避免。

比如輸入倒在血泊中的一匹馬,可能平臺(tái)會(huì)提示,請(qǐng)修改輸入語(yǔ)句。但是將語(yǔ)句調(diào)整為,一匹馬倒在紅色的湖泊中,AI就能自動(dòng)生成圖片了。這方面就需要平臺(tái)對(duì)搜索詞匯進(jìn)行甄別了。我們有理由相信,有著20年搜索引擎經(jīng)驗(yàn)的百度,無(wú)疑會(huì)比其他公司做得更好一些。困難雖然多,但是總會(huì)找到解決的方法,不至于因噎廢食。

百度董事長(zhǎng)兼首席執(zhí)行官李彥宏曾提出人工智能倫理的四原則,即 AI 的最高原則是安全可控;AI 的創(chuàng)新愿景是促進(jìn)人類更平等地獲取技術(shù)和能力;AI 的存在價(jià)值是教人學(xué)習(xí),讓人成長(zhǎng),而非超越人、代替人;AI 的終極理想是為人類帶來(lái)更多自由與可能。

“這是技術(shù)可以有所作為,也應(yīng)當(dāng)有所作為的方向”深以為然十分認(rèn)同!(文 / 知頓 書(shū)華 )

       原文標(biāo)題 : 今天,你“文生圖”了嗎?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)