国产SUV精品一区二区四区三区,欧美成人在线影院,欧美禁片在线播放

深蘭拿下首屆 LargeFineFoodAI賽道冠軍

2021-10-25 16:47

日前,兩年一度的計(jì)算機(jī)視覺(jué)領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議 ICCV 在加拿大蒙特利爾圓滿閉幕。在此期間,與大會(huì)同期舉行的首屆LargeFineFoodAI技術(shù)研討會(huì),由美團(tuán)視覺(jué)智能中心聯(lián)合中科院計(jì)算所、北京智源、巴塞羅那大學(xué)在Kaggle競(jìng)賽平臺(tái)上共同主辦,會(huì)議核心聚焦計(jì)算機(jī)視覺(jué)技術(shù)在大規(guī)模細(xì)粒度食品分析領(lǐng)域的應(yīng)用。

首屆 LargeFineFoodAI 比賽分為 Recognition 和 Retrieval 兩個(gè)賽道,根據(jù)研討會(huì)評(píng)選結(jié)果得知,深蘭DeepBlueAI團(tuán)隊(duì)在Large-ScaleFine-Grained Food Retrieval 賽道中取得了冠軍的成績(jī)。

賽題介紹

與通用圖像識(shí)別及檢索相比,食品細(xì)粒度識(shí)別及檢索技術(shù)難度更大。許多不同類型的食品外觀看起來(lái)可能非常相近,而同一種類型的食品也可能由于做法不同看起來(lái)差異較大,此外光線、拍攝角度、不同的拍攝背景都可能對(duì)算法的精度產(chǎn)生影響,即便對(duì)于專業(yè)人員也較難快速準(zhǔn)確的進(jìn)行辨別。

另一方面,相關(guān)技術(shù)具有廣泛的應(yīng)用場(chǎng)景和實(shí)際的應(yīng)用價(jià)值,例如降低商家端食品圖片的審核成本,提升C端食品圖片和視頻的分發(fā)效率等。美團(tuán)作為國(guó)內(nèi)領(lǐng)先的生活服務(wù)平臺(tái),準(zhǔn)確把握住消費(fèi)升級(jí)趨勢(shì)給餐飲行業(yè)的經(jīng)營(yíng)、消費(fèi)方式帶來(lái)的革命性變化,率先提出借助計(jì)算機(jī)視覺(jué)算法對(duì)食品圖像進(jìn)行細(xì)粒度分析,來(lái)快速響應(yīng)和滿足商戶和用戶大量多樣的在線食品圖像審核、管理、瀏覽、評(píng)價(jià)等需求。

本次挑戰(zhàn)賽所用數(shù)據(jù)集來(lái)自美團(tuán)自建數(shù)據(jù)集"Food2K",該數(shù)據(jù)集每一張美食圖片均由不同個(gè)人,采用不同設(shè)備,在不同環(huán)境場(chǎng)景下拍攝獲取,是難得的可以公正評(píng)價(jià)算法魯棒性和效果的圖片數(shù)據(jù),挑戰(zhàn)也非常大。并且所有圖像均由美團(tuán)公司的食品專家進(jìn)行評(píng)估,確保了數(shù)據(jù)的高質(zhì)量。相比其他主流食品圖像識(shí)別數(shù)據(jù)集,"Food2K"數(shù)據(jù)集完全人工標(biāo)注,數(shù)據(jù)集噪聲比例控制在 1% 以內(nèi);數(shù)據(jù)分布與真實(shí)場(chǎng)景相符,不平衡現(xiàn)象顯著;而且類別粒度更細(xì)。以披薩為例,主流數(shù)據(jù)集(例如Food-101)僅具有披薩類,而"Food2K"進(jìn)一步將其劃分為多種多樣的披薩,如鮮蝦披薩、榴蓮披薩等。

評(píng)測(cè)指標(biāo)

此外,為了進(jìn)一步推進(jìn)食品視覺(jué)分析領(lǐng)域的研究與實(shí)踐,吸引更多行業(yè)相關(guān)團(tuán)隊(duì)關(guān)注參與,美團(tuán)發(fā)起了以LargeFineFoodAI為主題的挑戰(zhàn)賽。該競(jìng)賽將分為兩大賽道,其一是“大規(guī)模食品圖像細(xì)粒度識(shí)別”,將采用Food1K數(shù)據(jù)集(包含1500種類別中的1000種食物類別),通過(guò)Top-1分類準(zhǔn)確率進(jìn)行算法評(píng)估;其二是“大規(guī)模食品圖像細(xì)粒度檢索”,將使用同賽道一的訓(xùn)練和驗(yàn)證集,使用剩余的Food500作為測(cè)試集,使用MAP@100進(jìn)行算法評(píng)估。

團(tuán)隊(duì)成績(jī)

團(tuán)隊(duì)成績(jī)排名

獲獎(jiǎng)證書(shū)

題目特點(diǎn)以及常用方法

圖像檢問(wèn)題現(xiàn)有研究比較多,但對(duì)于大規(guī)模、細(xì)粒度的圖像檢索比較新。圖像檢索最主要的就是特征提取網(wǎng)絡(luò),現(xiàn)有的的特征提取網(wǎng)絡(luò)主要基于卷積神經(jīng)網(wǎng)絡(luò)如ResNet、ResNest和EfficientNet等,無(wú)法像transformer一樣提取到更加豐富、區(qū)分度更高的特征。提取完特征后,在度量?jī)蓮垐D片相似度的階段單純使用余弦距離來(lái)計(jì)算精度很低,DeepBlueAI團(tuán)隊(duì)使用ReRank的方法將歐式距離和雅可比距離加權(quán)來(lái)度量query和gallery之間的相似度。

比賽數(shù)據(jù)與數(shù)據(jù)分析

本次比賽數(shù)據(jù)集包含超過(guò)1000個(gè)細(xì)粒度食物類別和超過(guò)50000張圖像的數(shù)據(jù)集。它包含西餐和中餐,每個(gè)類別的圖像數(shù)量在范圍內(nèi)[153; 1999],與現(xiàn)有的食物數(shù)據(jù)集相比,顯示出更大的類別不平衡。下圖顯示了它的本體和數(shù)據(jù)集的詳細(xì)統(tǒng)計(jì)信息:

從圖中可以看出,LargeFoodAI數(shù)據(jù)集,具有類別多、細(xì)粒度和類別不平衡等特點(diǎn)。

PIPELINE

如下圖所示,DeepBlueAI團(tuán)隊(duì)首先采用五折交叉驗(yàn)證的方法對(duì)數(shù)據(jù)進(jìn)行劃分;然后用Swin Transfomrer作為主干網(wǎng)絡(luò)提取特征;接著用BNNeck模塊對(duì)所提特征進(jìn)行歸一化操作;最后使用交叉熵和label smooth函數(shù)對(duì)模型進(jìn)行優(yōu)化。

實(shí)驗(yàn)?zāi)Ｐ?/strong>

Swin Transforme主干網(wǎng)絡(luò)

DeepBlueAI團(tuán)隊(duì)基于Swin Transformer主要實(shí)驗(yàn)了4種結(jié)構(gòu),swin_base_224, swin_base_384、swin_large_224和swin_large_384模型。下圖為Swin Transfomer的結(jié)構(gòu)圖:

Sharpness-AwareMinimization

(SAM)優(yōu)化器

SAM優(yōu)化器通過(guò)一種新的、有效的方法來(lái)同時(shí)減小損失值和損失的銳度,在領(lǐng)域內(nèi)尋找具有均勻的低損失值的參數(shù)。該方法通過(guò)求解最小-最大優(yōu)化問(wèn)題,使得梯度下降可以有效地執(zhí)行,在各種基準(zhǔn)數(shù)據(jù)集上都改善了模型得泛化能力。下圖為SGD優(yōu)化器和SAM優(yōu)化器的示意圖:

CutMix數(shù)據(jù)增強(qiáng)

DeepBlueAI團(tuán)隊(duì)采用CutMix數(shù)據(jù)增強(qiáng)的方法來(lái)擴(kuò)充數(shù)據(jù)的多樣性,同時(shí)也能提高模型對(duì)相似類別數(shù)據(jù)的區(qū)分度。

Rerank_qe

DeepBlueAI團(tuán)隊(duì)將所有數(shù)據(jù)中和query特征最為相似的40個(gè)特征的平均值作為新的query特征,用0．25的權(quán)值對(duì)歐式距離和雅可比距離進(jìn)行加權(quán)。ReRank方式如下圖所示:

模型融合

模型融合是算法大賽中常用的提高模型精度方法,DeepBlueAI團(tuán)隊(duì)最終選擇了swinb_224、swinb_384、swinl_224和swinl_384等不同主干和訓(xùn)練尺度生成的特征進(jìn)行模型融合,最終模型融合的結(jié)果為82．813mAP@100,取得了本次比賽第一的成績(jī)。

# 深蘭DeepBlueAI團(tuán)隊(duì)總結(jié)

我們?cè)谧畛踝鲞@個(gè)任務(wù)的時(shí)候,嘗試了許多基于CNN的主干網(wǎng)絡(luò),如ResNet、ResNeSt和EfficientNet等,但是發(fā)現(xiàn)這些主干網(wǎng)絡(luò)無(wú)論分類還是檢索的效果都不是很好。在分類任務(wù)使用Swin Transformer取得遠(yuǎn)優(yōu)于CNN網(wǎng)絡(luò)的效果之后,就把它移植到檢索任務(wù)里來(lái),取得了不錯(cuò)的成績(jī)。在進(jìn)一步的使用ReRank、Ensemble等檢索任務(wù)常用trick之后,取得了檢索任務(wù)第一的成績(jī)。

在數(shù)據(jù)處理方面,我們發(fā)現(xiàn)CutMix方法有效的增強(qiáng)了不同類別之間特征的區(qū)分度。SAM優(yōu)化器和LabelSmooth損失函數(shù)的采用,也進(jìn)一步的提高了模型的泛化能力和識(shí)別精度。

深蘭 LargeFineFoodAI 計(jì)算機(jī)視覺(jué)

相關(guān)閱讀
深蘭 LargeFineFoodAI 計(jì)算機(jī)視覺(jué)

【W(wǎng)AIE 2024（第九屆）人工智能產(chǎn)業(yè)大會(huì)】寶德計(jì)算機(jī)系統(tǒng)股份有限公司副總裁黃文杰確認(rèn)出席并發(fā)表演講 2024-08-09

計(jì)算機(jī)視覺(jué)與物體檢測(cè) 2023-04-17

通過(guò)實(shí)際示例學(xué)習(xí)計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)的基本技術(shù) 2023-04-03

2023 最新計(jì)算機(jī)視覺(jué)學(xué)習(xí)路線（入門(mén)篇） 2023-02-14

分析計(jì)算機(jī)視覺(jué)模型的性能 2023-02-06

分享
新浪微博騰訊QQ QQ空間微信

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫(xiě)，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問(wèn)所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：

密碼：

忘記密碼？

用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁，請(qǐng)輸入驗(yàn)證碼繼續(xù)

驗(yàn)證碼：刷新

最新評(píng)論

熱門(mén)評(píng)論

暫無(wú)評(píng)論

暫無(wú)評(píng)論

圖片新聞

喜迎新車間！干冒煙的小米車間可以緩口氣

月之暗面發(fā)布 Kimi 探索版：搜索量相比普通版增強(qiáng) 10 倍

三星半導(dǎo)體裁員，先動(dòng)高管

OpenAI亞太辦事處來(lái)了

上海設(shè)立100億人工智能生態(tài)基金，Minimax階躍星辰獲支持

諾獎(jiǎng)?lì)C給深度學(xué)習(xí)之父這件事

“AI 教母”李飛飛公司獲2.3億刀融資，AMD英特爾英偉達(dá)旗下公司參投

印度總理放豪言：印度將成芯片制造強(qiáng)國(guó)，呼吁加大對(duì)印投資