2019 Google物體挑戰(zhàn)賽結(jié)果正式揭曉 極鏈科技獲得金牌
近日,由Google主辦的2019 Google物體挑戰(zhàn)賽結(jié)果正式揭曉,首次參賽的極鏈科技AI團隊在僅剩兩個月的時間下贏得一枚金牌。
去年,在MS COCO停止舉辦物體邊框識別的比賽后,Google發(fā)布了自己的第一屆物體識別的比賽,有400多名研究人員和機器學習研究人員參加。今年,作為ICCV的workshop之一,谷歌在Open Image V5數(shù)據(jù)集的基礎(chǔ)上推出了第二屆物體比賽,且測試集與第一屆完全相同。
連續(xù)兩年Google Open Images - Object Detection Track接棒COCO物體識別比賽,作為計算機視覺領(lǐng)域的“黃金標準型”,吸引了大量團隊的參與,以獲得在Open Images數(shù)據(jù)集上的最低的錯誤率,今年也是吸引了560余支隊伍。同時,深度學習技術(shù)的突破更是使得圖像識別任務(wù)取得令人矚目的巨大進步,甚至超過了人類的準確度。
隨著深度網(wǎng)絡(luò)解決方案變得越來越深,越來越復(fù)雜,它們通常受到可用培訓數(shù)據(jù)量的限制?紤]到這一點,為了刺激分析和理解圖像的進步,Google公開發(fā)布了Open Images數(shù)據(jù)集。Open Images遵循了PASCAL VOC,ImageNet和COCO的傳統(tǒng),現(xiàn)已達到前所未有的規(guī)模。
作為CV(Computer Vision)領(lǐng)域的熱門分支,物體識別有著廣泛的應(yīng)用場景,從已經(jīng)十分成熟的車輛車牌識別、行人檢測,到近些年來新興的無人駕駛所需要的各種目標的識別。隨著不斷新增的需求,人們對識別準確率的要求也是水漲船高。2018年ECCV的Open Images Workshop中,谷歌團隊解釋了Open Image物體識別比賽和其他類似比賽的區(qū)別和具有挑戰(zhàn)性的地方,即擁有更為大量的數(shù)據(jù)、標簽種類、數(shù)據(jù)分布不均衡、提供標簽從屬關(guān)系信息以及數(shù)據(jù)標注不絕對完整。相比于COCO,此數(shù)據(jù)集的多樣性要大得多,并且對最先進的實例識別方法構(gòu)成了更大的挑戰(zhàn);谶@個數(shù)據(jù)集, Google號召全球的計算機視覺領(lǐng)域的科學精英共同參與,共同朝著更復(fù)雜的地標檢測計算機視覺模型邁出巨大的一步。這也是目前最大、最詳盡的公開數(shù)據(jù)。
作為極鏈的明星平臺之一,「金目」用包括物體、場景等各個維度的識別為用戶帶來豐富且十分精準的體驗。當然在其中,物體識別扮演著不可或缺的角色。出于對前沿技術(shù)、算法的不斷探索,我們也借由這次比賽,夯實團隊在物體識別上的能力。
針對本次比賽數(shù)據(jù)分布極為不均衡,我們對數(shù)量較少的標簽進行了數(shù)據(jù)增廣。在算法框架的選擇上,目前Two stage的物體識別算法相比One stage在準確度上有較為明顯的優(yōu)勢,而Cascade RCNN算法更是當下各個物體比賽的熱門選擇。不過Cascade級聯(lián)的方式也導(dǎo)致了速度的下降,并不適用于實際場景?紤]到自身平臺的實際應(yīng)用場景,我們選擇了速度更快也更為經(jīng)典的Faster-RCNN。接下來是Backbone,當下大量針對比賽的選擇基本趨于更深和更復(fù)雜的算法,比如為Fackbook創(chuàng)造Imagenet 84.5%(Top1)準確率的ResNeXt101(32x48d)、SENet等等。而這類模型有個共同的特點,非常的龐大,對訓練和測試的時間也都有較大的增加。此外,為了達到更高的準確率,參賽者們更傾向于訓練不同框架、不同Backbone的算法,通常為6個甚至更多,最后進行融合。這對整體的效率、性能的影響也是可想而知的。而比賽是為了更好地改善算法或技術(shù)的實際落地效果;谶@個初衷,我們僅選擇了ResNeXt-101(64x4d)和ResNet-152這兩個相對更平衡的Backbone。在測試階段,用了多尺度測試以及內(nèi)部各個周期的結(jié)果融合。此外,我們利用SoftNMS對兩個算法的結(jié)果進行了融合得到了最終的結(jié)果。
最終,團隊在public榜單上的分數(shù)為0.62163,private為0.58259,獲得了一枚金牌。
極鏈科技作為全球視聯(lián)網(wǎng)-視頻商業(yè)操作系統(tǒng)的構(gòu)建者,堅持以AI技術(shù)賦能視頻中的信息,鏈接互聯(lián)網(wǎng)信息、服務(wù)、購物、社交、游戲五大模式,實現(xiàn)基于視頻的新互聯(lián)網(wǎng)經(jīng)濟體與客戶價值倍增。這次對Google AI Open Images - Object Detection Track競賽的實踐,是極鏈科技「金目」系統(tǒng)視頻識別物體算法領(lǐng)域的優(yōu)化,也是為了更好的支持視聯(lián)網(wǎng)的服務(wù)與賦能。未來,極鏈也將持續(xù)探索前沿領(lǐng)域的技術(shù)突破,促進人工智能生態(tài)圈的持續(xù)快速發(fā)展。
最新活動更多
-
即日-10.29立即報名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月14日立即報名>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
推薦專題
- 1 Intel宣布40年來最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國產(chǎn)AI芯片公司破產(chǎn)!白菜價拍賣
- 5 具身智能火了,但規(guī)模落地還需時間
- 6 三次錯失風口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 7 國產(chǎn)英偉達們,抓緊沖刺A股
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來
- 9 英偉達的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實力拉滿
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市