日本免费aaa片一区二区三区,台湾中文免费娱乐网,国产精品va在线观看浪潮

谷歌提出Context R-CNN, 利用時(shí)域上下文信息的增強(qiáng)目標(biāo)檢測系統(tǒng)

2020-07-06 16:05

這種方法超過了僅僅使用單幀圖像的FasterR－CNN方法，在多個(gè)生態(tài)環(huán)境圖像檢測領(lǐng)域內(nèi)都具有明顯的優(yōu)勢。研究人員已將模型整合到TF Object Detection API中，為相關(guān)研究人員提供更為簡化的訓(xùn)練和部署。

上圖中顯示了上下文信息（長達(dá)一個(gè)月）是如何幫助專家確定模糊場景中的動(dòng)物的。上下文中目標(biāo)形狀、尺寸、每天固定的食草時(shí)間幫助算法確定這是角馬。

上下文R－CNN模型

上下文R－CNN主要利用靜態(tài)相機(jī)拍攝圖像序列間的高度相關(guān)性，在無需額外人工標(biāo)注數(shù)據(jù)的情況下提升算法在復(fù)雜情況下的性能，同時(shí)改善在新的相機(jī)設(shè)置下的泛化性。與Faster R－CNN類似，它也采用了兩階段目標(biāo)檢測架構(gòu)。

上圖顯示了上下文R－CNN的頂層架構(gòu)，顯示了檢測模型與長期上下文信息如何有效系統(tǒng)提升性能。

為了抽取某一相機(jī)的上下文信息，研究人員首先利用參數(shù)固定的特征抽取器從較大的時(shí)間跨度中構(gòu)建出上下文存儲空間（下圖中M）；隨后每幅圖像在對應(yīng)上下文信息聚合的幫助下，上下文R－CNN將會更好地在復(fù)雜情況下對目標(biāo)進(jìn)行檢測（包括低光、濃霧、模糊等場景）。這種聚合利用attention方式實(shí)現(xiàn)，它對靜態(tài)相機(jī)中出現(xiàn)的稀疏和非規(guī)則采樣具有較好的魯棒性。

第一階段的Faster R－CNN將提出潛在目標(biāo)，而第二階段將對每個(gè)候選目標(biāo)進(jìn)行分類。在Context R－CNN中針對第一階段的候選目標(biāo)，使用基于相似性的注意力機(jī)制來確定當(dāng)前目標(biāo)與記憶池中特征的相關(guān)性。隨后利用相關(guān)性權(quán)重加權(quán)記憶池中的特征來構(gòu)建針對這一目標(biāo)的上下文特征，并將其添加到原始的目標(biāo)特征后，送入第二階段的Faster R－CNN中進(jìn)行最終的分類。