訂閱
糾錯(cuò)
加入自媒體

別只關(guān)心315打老虎,來(lái)看看全年無(wú)休的AI打假

2023-03-16 08:58
腦極體
關(guān)注

一年一度的“3·15”消費(fèi)者權(quán)益日如期而至,這一天,全民最期待、各家公關(guān)最緊張的環(huán)節(jié),應(yīng)該是“打老虎”的高光時(shí)刻。

某些高高在上的巨頭或大牌的“套路”被曝光,次日忙不迭道歉整改,讓廣受其害但維權(quán)困難的消費(fèi)者們拍手稱快,這樣的故事大家已經(jīng)耳熟能詳了。但在3月15日這一天之外,人們?nèi)粘_會(huì)面臨各式各樣、層出不窮的造假售假,不能都指望一天時(shí)間、一臺(tái)晚會(huì)、打幾只老虎來(lái)解決。

能夠全年無(wú)休的AI打假師,也就被科技企業(yè)推進(jìn)了大眾的視野。不過(guò),想要真的用好AI打假,還要對(duì)它的邏輯、能力和有限性,有一定的了解。

本文希望通過(guò)科普AI打假的段位,幫大家在日常維權(quán)時(shí)用好科技的武器。

初級(jí)段位:機(jī)器視覺(jué)PK假貨

提到打假,很多人日常接觸到的假東西,應(yīng)該是各類假冒偽劣、以假亂真的消費(fèi)品。以消費(fèi)者服務(wù)平臺(tái)——黑貓投訴為例,對(duì)假貨、售假、貨不對(duì)板的投訴量非常之大。

先說(shuō)AI應(yīng)用在貨品打假上的基本邏輯。

邏輯:人工打假難、打假貴、周期長(zhǎng)、套路多——通過(guò)機(jī)器視覺(jué)提升“眼力”。

人工打假難:隨著現(xiàn)代制作工藝技術(shù)越發(fā)精湛,越來(lái)越多的“大牌”包包、高仿潮鞋、收藏品偽作,不再是粗制濫造的“一眼假”,可以做到以假亂真的地步,看走眼的專家數(shù)不勝數(shù)。有些造假技藝出神入化的“古玩”,甚至連專業(yè)儀器都不能準(zhǔn)確鑒定。

人工打假貴:人工甄別需要多名鑒定師“背靠背”鑒定,因此收費(fèi)也往往是在線鑒定的數(shù)倍。國(guó)內(nèi)某奢侈品鑒定平臺(tái),在線鑒定49元,實(shí)物鑒定收費(fèi)則達(dá)到199元。

周期長(zhǎng):制假售假販假大多是流水線式團(tuán)隊(duì)作戰(zhàn),批量生產(chǎn),加上越來(lái)越多生活富裕的人加入消費(fèi)/收藏的隊(duì)伍,交易數(shù)量多,相應(yīng)的投訴量也增多,維權(quán)周期也很長(zhǎng),很多消費(fèi)者只能選擇自認(rèn)倒霉。

套路多:很多人覺(jué)得,專家的意見(jiàn)很可靠,專業(yè)機(jī)構(gòu)出具的證書(shū)有背書(shū)作用,但架不住造假套路太多,市場(chǎng)上充斥著僅在鑒定培訓(xùn)班學(xué)習(xí)過(guò)幾天而取得“結(jié)業(yè)證書(shū)”的廉價(jià)大師,還有不具備相應(yīng)條件又未經(jīng)過(guò)合法審批的鑒定中介機(jī)構(gòu)渾水摸魚(yú),證書(shū)只要給錢就能出,所以即使人工鑒定也可能陷入套路。

所以,近年來(lái)通過(guò)在線平臺(tái),用戶拍攝照片上傳,AI系統(tǒng)比對(duì)鑒定,變得流行起來(lái)。有企業(yè)推出的“AI鑒定師”,一秒鐘能識(shí)別20個(gè)假冒商標(biāo),有的藝術(shù)品鑒定,可以對(duì)文物進(jìn)行“一物一圖”的識(shí)別鑒定,規(guī)避仿造的問(wèn)題。這些都是靠什么能力實(shí)現(xiàn)的呢?

能力:機(jī)器視覺(jué)的快、準(zhǔn)、惠。

面對(duì)假貨,沒(méi)有“眼力”就會(huì)處于弱勢(shì)。機(jī)器視覺(jué)是AI的一個(gè)分支,讓機(jī)器能夠“看”和“理解”視覺(jué)信息,類似于人類的“眼力”。

首先,機(jī)器視覺(jué)系統(tǒng)會(huì)對(duì)物品的高精度圖像進(jìn)行識(shí)別和分析,提取出物品的形狀、顏色、紋理等相關(guān)特征。

然后,系統(tǒng)結(jié)合已知真假貨的數(shù)據(jù)集,根據(jù)真假貨的規(guī)律和特征,比如正品大牌包包的五金件顏色,logo字母的形狀等,進(jìn)行比照。

當(dāng)然,隨著造假技術(shù)的提高,很多直觀的細(xì)節(jié)不再是造假的難點(diǎn),僅僅單一特征的圖像比對(duì)是不夠的。比如有的古籍造假,會(huì)使用年代久遠(yuǎn)的紙張,文字或圖案通過(guò)軟件調(diào)色貼近真跡,真中有假,假中藏真,讓很多專家也只能憑感覺(jué)“覺(jué)得哪里不對(duì)”,而AI算法可以快速找到多種特征的彼此矛盾之處,找到真假“雜拼”的違和感,再由人工鑒定師進(jìn)行判斷。

通過(guò)機(jī)器視覺(jué),可以快速、準(zhǔn)確地識(shí)別出假貨特征,與人工鑒定相結(jié)合,降低鑒定的整體成本。

有限性:造假升級(jí),數(shù)據(jù)瓶頸

當(dāng)然,基于機(jī)器視覺(jué)的在線鑒定,還不能百分百取代人工鑒定,技術(shù)的有限性主要來(lái)自于:

一是造假手段的科技化。造假不可怕,就怕造假的人有文化,現(xiàn)在很多產(chǎn)品的造假技術(shù)也上了一個(gè)新的臺(tái)階,比如購(gòu)入正品后,拆解成幾個(gè)部分,再拼湊在一起高價(jià)賣出;有的大牌包包在各種細(xì)節(jié)上都與正品一致,不同的可能是五金件的銅含量不一樣,這就需要借助專業(yè)的金屬檢測(cè)設(shè)備,僅靠機(jī)器視覺(jué)識(shí)別是不夠的。

二是真假數(shù)據(jù)的限制。機(jī)器視覺(jué)算法的準(zhǔn)確率,需要龐大的真假貨特征數(shù)據(jù)集來(lái)支持,而大牌產(chǎn)品更新?lián)Q代很快,數(shù)據(jù)集的速迭代速度如果跟不上,就會(huì)讓新款假貨成為漏網(wǎng)之魚(yú)。此外,很多藝術(shù)品/收藏品都是孤件,收藏家沒(méi)有動(dòng)力將其數(shù)字化后共享數(shù)據(jù),這也會(huì)影響算法結(jié)果的準(zhǔn)確度。同時(shí),很多鑒定標(biāo)準(zhǔn)都是行業(yè)專家口口相傳的口訣,沒(méi)有形成一定的算法規(guī)則,垂直品類如紫砂壺、明青花等,行業(yè)知識(shí)匱乏、數(shù)據(jù)稀疏,也會(huì)影響算法的有效性。

這里要說(shuō)的是,以假亂真的造假,更多用于藝術(shù)品、奢侈品等價(jià)值昂貴的產(chǎn)品上,吸引的群體比較有限。正是市面上大量流通的大眾消費(fèi)品,才導(dǎo)致了規(guī)模龐大的受害者,而這些產(chǎn)品的造假一般不會(huì)費(fèi)心地精益求精,AI的到來(lái),無(wú)疑提供了一把價(jià)廉物美的打假武器。

中級(jí)段位:Anti-Deepfake PK Deepfake

造謠一張嘴,辟謠跑斷腿。當(dāng)深度偽造技術(shù)Deepfakes換臉輕而易舉,圖像、音頻以假亂真,很多人的臉被拿來(lái)做成虛假視頻,在網(wǎng)絡(luò)上瘋狂傳播,近年來(lái)越來(lái)越地引發(fā)維權(quán)。

邏輯:Deepfake帶來(lái)的偽造危機(jī)——更強(qiáng)大的Anti-Deepfake自動(dòng)甄別技術(shù) “攻子之盾”。

你也許會(huì)說(shuō),被改頭換面是公眾人物、明星的煩惱,自己只是個(gè)普通人,干嘛要擔(dān)心AI換臉。試想一下,這樣的形象造假越來(lái)越多,讓網(wǎng)絡(luò)上的信息真?zhèn)坞y辨,權(quán)威專家的嘴型可以p,領(lǐng)導(dǎo)人的臉可以換,那會(huì)讓沒(méi)有專業(yè)辨識(shí)能力的普羅大眾,陷入謠言和欺騙的信息海洋,在無(wú)形中損傷了整個(gè)社會(huì)的互信,引發(fā)集體信任危機(jī)。

此外,如果Deepfakes被用于非法用途,如詐騙、敲詐勒索等,很難保證黑客不會(huì)將其產(chǎn)業(yè)化、普及化,這樣就會(huì)對(duì)更廣大的群體帶來(lái)形象和經(jīng)濟(jì)上的損害。我

我曾采訪過(guò)一家智能金融機(jī)構(gòu),對(duì)方提到,通過(guò)在線視頻確認(rèn)借款人身份時(shí),就可能會(huì)遇到深度偽造視頻的攻擊,提高了風(fēng)控的難度。

所以,檢測(cè)和消除深度偽造圖像和視頻,避免技術(shù)被惡意利用,也成為許多科技公司打造負(fù)責(zé)任的技術(shù)的一種選擇。

能力:基于GAN(生成式對(duì)抗網(wǎng)絡(luò))的Anti-Deepfake算法,使用多個(gè)深度學(xué)習(xí)模型對(duì)輸入數(shù)據(jù)進(jìn)行分析,提取出視覺(jué)、語(yǔ)音和動(dòng)態(tài)特征,并將它們結(jié)合為一個(gè)特征向量,與已知的生物特征進(jìn)行比較。

Deepfakes算法不是完美的,缺少常識(shí),所以偽造的臉存在很多不對(duì)勁的特征,但這些面孔本身看起來(lái)很逼真,靠人的肉眼“找茬”有點(diǎn)費(fèi)勁,但AI可以快速找到這些線索。

比如一只耳朵上沒(méi)有戴耳環(huán)(除非她是一個(gè)叛逆朋克少女),牙齒數(shù)量以及方向不對(duì),衣服或背景的形態(tài)很不合常理。

注意看,中牙非常小,耳朵也很怪

有科學(xué)家找到了一種檢測(cè)偽造的方法,研究團(tuán)隊(duì)發(fā)現(xiàn)Deepfakes難以準(zhǔn)確再現(xiàn)常規(guī)的瞳孔。真正的人類瞳孔是一個(gè)規(guī)則的橢圓形,而Deepfakes生成的瞳孔明顯不規(guī)則,因?yàn)樗鼘?duì)人臉結(jié)構(gòu)沒(méi)有生理常識(shí)。

(來(lái)源:arxiv.org/abs/2109.00162)

此外,有的偽造線索是動(dòng)態(tài)的,比如聲音和口型對(duì)不上,需要檢測(cè)算法提取視頻的音、畫(huà)特征進(jìn)行分析匹配。

有限性:真?zhèn)斡螒,永無(wú)止境

通過(guò)AI自動(dòng)檢測(cè)來(lái)識(shí)別深度偽造的音視頻,根本挑戰(zhàn)在于偽造技術(shù)進(jìn)化得非?。

2018年紐約州立大學(xué)開(kāi)發(fā)出一款“反換臉”AI刑偵工具,通過(guò)預(yù)測(cè)眼睛是否眨動(dòng)的狀態(tài)來(lái)識(shí)別偽造人臉,準(zhǔn)確率達(dá)到 99%,但這款工具還沒(méi)推廣就失效了,因?yàn)镈eepfakes技術(shù)進(jìn)化了。

自動(dòng)檢測(cè)算法需要在高質(zhì)量的數(shù)據(jù)集上進(jìn)行訓(xùn)練,這些數(shù)據(jù)集要包括真實(shí)數(shù)據(jù)和合成數(shù)據(jù),如果數(shù)據(jù)的多樣性不足,訓(xùn)練視頻和測(cè)試視頻的相似性很高,那么實(shí)際檢測(cè)的效果也會(huì)不理想。

此外,用戶發(fā)現(xiàn)被深度偽造內(nèi)容侵權(quán)后,問(wèn)責(zé)和維權(quán)是非常難的,一般首先問(wèn)責(zé)的是平臺(tái),對(duì)侵權(quán)視頻/賬號(hào)做出下架、刪除、處罰等處理,但整個(gè)過(guò)程不確定性很大,還要和平臺(tái)企業(yè)的客服、運(yùn)營(yíng)、公關(guān)、法務(wù)等多部門交鋒,非常繁瑣,很多用戶只能選擇不了了之。用戶監(jiān)督對(duì)檢測(cè)技術(shù)的升級(jí),影響有限。

只能希望數(shù)據(jù)隱私保護(hù)的相關(guān)法律持續(xù)完善和落地,科技企業(yè)加強(qiáng)技術(shù)倫理和研發(fā),在這場(chǎng)真?zhèn)味贩ㄖ胁粩啾U嫌脩舻臋?quán)益。

高級(jí)段位:AI內(nèi)容識(shí)別器PK AI作弊

ChatGPT的出現(xiàn),將AIGC帶入了新的巔峰。據(jù)《紐約時(shí)報(bào)》報(bào)道,大型語(yǔ)言模型(LLM)生成的文本,與人類編寫(xiě)的文本難以區(qū)分,資深大學(xué)教授也無(wú)法準(zhǔn)確區(qū)分學(xué)生是否用ChatGPT寫(xiě)了論文作業(yè)。

所以,為了防止學(xué)生用AI作弊,紐約公立學(xué)校已全面禁止使用ChatGPT,美國(guó)一些學(xué)區(qū)也開(kāi)始采取這一措施。

還有科學(xué)家讓AI來(lái)檢測(cè)ChatGPT撰寫(xiě)的醫(yī)學(xué)研究摘要,不僅比論文剽竊檢測(cè)器的效果好得多,而且比人類審稿人的成績(jī)還高。也就是說(shuō),ChatGPT撰寫(xiě)的論文摘要,已經(jīng)可以讓人類專家都難辨真假了。

而就在今天,GPT-4問(wèn)世,支持多模態(tài)的生成任務(wù),對(duì)代碼有超強(qiáng)的理解能力,這也使得AI內(nèi)容識(shí)別器成為了一項(xiàng)必需品,來(lái)避免AIGC快速發(fā)展拉大“假內(nèi)容”的識(shí)別難度。

邏輯:大型語(yǔ)言模型強(qiáng)大的生成能力導(dǎo)致AI淪為作弊工具——AI內(nèi)容識(shí)別器,檢測(cè)內(nèi)容是人類寫(xiě)的還是AI寫(xiě)的。

能力:不詳。

是的,作為一種最新最前沿的造假手段,目前還沒(méi)有一種技術(shù)或軟件,能夠有效且準(zhǔn)確地識(shí)別出用ChatGPT作弊內(nèi)容。

AI內(nèi)容識(shí)別的方法,目前有兩種:

一種是黑盒檢測(cè),即通過(guò)統(tǒng)計(jì)特征的分析,找到AI文本和人類文本的區(qū)別,已經(jīng)有多個(gè)團(tuán)隊(duì)或開(kāi)發(fā)者,推出了相應(yīng)的解決方案。

比如普林斯頓大學(xué)計(jì)算機(jī)科學(xué)專業(yè)的華裔學(xué)生Edward Tian開(kāi)發(fā)的GPTZero,號(hào)稱可以通過(guò)分析語(yǔ)言模型對(duì)文本的“喜愛(ài)”程度,以及AI寫(xiě)作一段文本時(shí)的“困惑”程度,通過(guò)“親AI”分?jǐn)?shù)來(lái)判斷文章是否出自AI之手。

斯坦福大學(xué)提出的DetectGPT,認(rèn)為人寫(xiě)文章和模型樣本的攝動(dòng)差異分布有顯著差異,通過(guò)這個(gè)差異來(lái)檢測(cè)一段文本是否由模型生成。

OpenAI也在前不久推出了AI生成內(nèi)容識(shí)別器,但博客數(shù)據(jù)顯示,檢出成功率只有26%,對(duì)英文以外的語(yǔ)言,檢測(cè)效果要差很多,并且不支持1000字符以內(nèi)的短文本(因?yàn)槿祟悓?xiě)的和AI寫(xiě)的答案可能是一樣的)。而且,一些AI生成的文本經(jīng)過(guò)編輯之后,也可能規(guī)避掉檢測(cè)。

大模型能力的提升,使得AIGC和人類的差距越來(lái)越小,導(dǎo)致AI內(nèi)容識(shí)別器的檢測(cè)準(zhǔn)確性也難以保障。比如最新的GPT-4,表現(xiàn)相比GPT-3.5有了大幅提升,之前針對(duì)GPT-3等大型語(yǔ)言模型的檢測(cè)工具,都面臨失效的風(fēng)險(xiǎn)。

(GPT-4在大多數(shù)測(cè)試中表現(xiàn)優(yōu)于GPT-3.5)

另一種是白盒檢測(cè),即模型的開(kāi)發(fā)人員對(duì)AI內(nèi)容進(jìn)行一定的處理,從而滿足檢測(cè)目的。

此前OpenAI就聲稱,考慮給AI內(nèi)容加上水印,在詞匯選擇上加入“不引人注意的秘密信號(hào)”,這樣就能證明這段文字是 GPT 模型生成的。

這一方法的問(wèn)題是,只能由模型開(kāi)發(fā)者植入水印,模型開(kāi)源之后可以通過(guò)微調(diào)來(lái)移除水印,也會(huì)失效。

有限性:AI檢測(cè)技術(shù)的進(jìn)步,慢于AI生成技術(shù)的進(jìn)步。

說(shuō)了這么多,當(dāng)然不是為了把AI等新技術(shù)生成的東西都“一棒子打死”。

今天,我們能在博物館里看到臨摹仿制的復(fù)制品,這種“假”與欺騙無(wú)關(guān);能靠Deepfakes將失德藝人的臉換掉,讓作品繼續(xù)上映,保住整個(gè)制作團(tuán)隊(duì)的心血;能用AI畫(huà)出自己想象中的場(chǎng)景,當(dāng)然也不能算是造假……

物品沒(méi)有對(duì)錯(cuò),技術(shù)沒(méi)有好壞,錯(cuò)的只是人心,只是握刀的那只手。

作為普通人,我們能做的就是“知己知彼”,了解造假技術(shù)的邏輯、能力和局限,將捍衛(wèi)自身權(quán)益的武器,掌握在自己手里。

       原文標(biāo)題 : 別只關(guān)心315打老虎,來(lái)看看全年無(wú)休的AI打假

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)