訂閱
糾錯(cuò)
加入自媒體

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

經(jīng)過圖像處理后,每個(gè)循環(huán)群

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

將變化為

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

命題3里,我們假設(shè)T和J具備交換律,那么我們可以將上面的公式改寫,并得到

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)


CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

原分布D不具備視覺手性意味著:每個(gè)循環(huán)群

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

中的元素都有相同的概率出現(xiàn)。因此,由于經(jīng)過J圖像處理后循環(huán)群變?yōu)榱?/p>

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

,我們只需要證明以下運(yùn)算為同態(tài)(homomorphism):

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

因?yàn)閷?duì)于同態(tài)來說,根據(jù)第一同構(gòu)基本定理(First Isomorphism Theorm)可以推理出每個(gè)輸出對(duì)應(yīng)著相同數(shù)量的輸入。而因?yàn)槊總(gè)循環(huán)群中單個(gè)輸入

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

在原分布D上有著相同的概率,意味著每個(gè)輸出

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

也具備相同的概率,也意味著

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

不具備視覺手性。證明同態(tài)的步驟如下:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

以上為命題3的證明。通過命題3,我們知道了J和T的交換律與處理后圖像分布的視覺手性的關(guān)系。那么,只需要通過檢查交換律,我們便可以判斷圖像處理是否可能產(chǎn)生新的視覺手性。檢查的方式也很簡單,對(duì)于任意圖片x,我們只需要計(jì)算其交換殘差(commutative residual)是否為0:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

下圖形象的解釋了交換殘差的計(jì)算過程:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

文中使用去馬賽克、JPEG壓縮、以及兩者結(jié)合這三種圖像處理方法,對(duì)于鏡像翻轉(zhuǎn)這一圖片變換方式分別計(jì)算了交換殘差。

當(dāng)去馬賽克處理的圖像寬度為奇數(shù)時(shí),處理后的圖像分布可能具備視覺手性;反之如果為偶數(shù),則不具備視覺手性。當(dāng)JPEG壓縮的圖片不為16整除時(shí),處理后的圖像分布可能具備視覺手性,反之則不具備。當(dāng)兩者結(jié)合后,處理后的圖片一定具備視覺手性:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

作者為了驗(yàn)證這些結(jié)論,在原本不具備視覺手性的人工數(shù)據(jù)集(高斯分布生成的隨機(jī)圖片)上,對(duì)不同寬度的圖片分別進(jìn)行了這三種處理,并使用神經(jīng)網(wǎng)絡(luò)進(jìn)行了自監(jiān)督學(xué)習(xí)。實(shí)驗(yàn)結(jié)果符合這一測(cè)試的預(yù)期。因?yàn)榇罅炕ヂ?lián)網(wǎng)圖片都經(jīng)過了去馬賽克和JPEG壓縮,這一結(jié)論意味著數(shù)字圖像處理所帶來的視覺手性現(xiàn)象在互聯(lián)網(wǎng)圖片中廣泛存在。

當(dāng)加入隨機(jī)剪裁(random cropping)后,我們還能得到這一結(jié)論么?作者的答復(fù)是肯定的。

為了理解隨機(jī)剪裁對(duì)于視覺手性的影響,作者提到了兩個(gè)關(guān)鍵點(diǎn)。

第一點(diǎn):命題三中只討論了單種J的情況。而隨機(jī)剪裁可以被視為許多種J(例如

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

是向右平移一格并剪裁,

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

是向右平移兩個(gè)并剪裁)的結(jié)合,每一種有相同概率出現(xiàn)。

第二點(diǎn):命題三中并沒有討論T和J不具備交換律的情況。例如當(dāng)J是向?qū)D片右平移十個(gè)像素并進(jìn)行一次中心剪裁時(shí),T和J無法具備交換律。在這種情況下,新的圖像分布并不一定具備視覺手性。

對(duì)于第一點(diǎn)來說,假設(shè)我們有多種不同的J(例如

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

,

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

),而他們分別與T具備交換律時(shí),我們可以用以下公式表達(dá)新的圖像分布:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識(shí)別鏡像翻轉(zhuǎn)

<上一頁  1  2  3  4  下一頁>  余下全文
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)