侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

360AI研究院高級技術(shù)總監(jiān)陳強(qiáng)博士:中國新一代人工智能關(guān)鍵共性技術(shù)體系的現(xiàn)狀和突破點(diǎn)

8月30日-31日,由中國高科技行業(yè)門戶OFweek維科網(wǎng)、高科會主辦,OFweek人工智能網(wǎng)承辦的“OFweek(第二屆)中國人工智能產(chǎn)業(yè)大會”在上?鐕少彆怪行睦_帷幕。

此次會議旨在搭建專為人工智能圈內(nèi)企業(yè)和從業(yè)人員交流合作的專業(yè)平臺,匯集人工智能領(lǐng)域的國際知名企業(yè)高層、行業(yè)資深專家、專家分析機(jī)構(gòu)等數(shù)千位精英,1000+人工智能專業(yè)人士共同探討人工智能難題以及產(chǎn)業(yè)落地,提前布局未來大市場。

會上,主辦方邀請了多名重量級嘉賓和企業(yè)代表進(jìn)行演講,精彩的演講贏得現(xiàn)場觀眾陣陣掌聲,現(xiàn)場人聲鼎沸,極其火爆。

在本次論壇上,360AI研究院高級技術(shù)總監(jiān)陳強(qiáng)博士向數(shù)千名觀眾及媒體分享了中國新一代人工智能關(guān)鍵共性技術(shù)體系的現(xiàn)狀和突破點(diǎn)。

會上,陳強(qiáng)博士詳細(xì)介紹了360視頻大腦的三大模塊:安全(網(wǎng)絡(luò)安全、線下安全)、IOT智能硬件(360攝像頭、360兒童、360車聯(lián)網(wǎng))、內(nèi)容分發(fā)(探索、短視頻、直播、信息流)。以及如何在目前內(nèi)容結(jié)構(gòu)化、IOT智能硬件設(shè)備數(shù)上漲迅猛、4G/5G的普及、互聯(lián)網(wǎng)內(nèi)容流量逐漸以視頻為主的趨勢下,提高短視頻分析率、安防監(jiān)控每日人臉比對次數(shù)、端上AR特效平臺輸出可次數(shù)。

以下為陳強(qiáng)博士的現(xiàn)場演講內(nèi)容,OFweek人工智能網(wǎng)作了不改變原意的整理和編輯:

大家下午好,首先感謝維科網(wǎng)盛情邀請,我這次來參加比較有意思的會場,首先稍微解釋一下,因?yàn)橐婚_始發(fā)布的題目有點(diǎn)大,然后我一看時(shí)間只有20分鐘,所以稍微改了一下題目,其實(shí)這個(gè)題目也符合現(xiàn)在人工智能發(fā)展的現(xiàn)狀,從講人工智能技術(shù)到現(xiàn)在結(jié)合場景以及結(jié)合具體的產(chǎn)品去講人工智能落地的問題。

人工智能的背景

我們講人工智能要去解決一個(gè)問題,不論是AI+行業(yè)還是行業(yè)+AI,我們往往會從四個(gè)方面來討論這個(gè)問題。我們關(guān)注的問題是人工智能技術(shù)在什么樣場景下拿到什么樣的數(shù)據(jù),然后結(jié)合一定的算法和算力來去解決具體的問題。一般的公司和一般的稍微帶點(diǎn)平臺型的公司,他們比較大的區(qū)別在于平臺類公司往往會在算法和算力上稍微好一點(diǎn),他們的技術(shù)研發(fā)能力會比較強(qiáng)。但是作為創(chuàng)業(yè)者公司來說,他可以在具體的場景和具體的數(shù)據(jù)層面達(dá)到不一樣的效果。所以今天我的主題演講主要從場景、概念和數(shù)據(jù)這三個(gè)層面來給大家介紹一下我們在360內(nèi)部做的事情。

首先稍微介紹一下, 360為什么要做人工智能這一塊。360在人工智能和自己的業(yè)務(wù)是如何去結(jié)合的?其實(shí)360在大眾的眼里面可能更多是一個(gè)安全類的公司,但是實(shí)際上360的主營業(yè)務(wù)一直是有兩個(gè)層面,表是安全,里是內(nèi)容,也就是在傳統(tǒng)的互聯(lián)網(wǎng)內(nèi)容之中,人工智能起到?jīng)Q定性的作用。所謂的安全,我們更希望是從線上的安全慢慢拓展到線下的安全。再到內(nèi)容這一塊,AI所賦能的更多是因?yàn)槲覀兿M鸄I能夠讓信息的生產(chǎn)、信息的分析和獲取能夠更加智能,能夠得到更高效的效果。所以結(jié)合360線上線下的產(chǎn)品,我們AI研究院主要提供了很多產(chǎn)品化方案。

AI在整個(gè)互聯(lián)網(wǎng)行業(yè)已經(jīng)是一個(gè)標(biāo)準(zhǔn)化工具,在過去兩年中,隨著互聯(lián)網(wǎng)向線下的一個(gè)發(fā)展,以及互聯(lián)網(wǎng)向內(nèi)容分發(fā)效率的發(fā)展,我們覺得可能更多是要去做一些視頻方向的具體事情。我們目前在360內(nèi)部試產(chǎn)一點(diǎn)的戰(zhàn)略叫一點(diǎn)兩一。什么叫一點(diǎn)?就是我們的核心價(jià)值在于360安全這一塊,所以線上安全和線下建設(shè)安全這兩塊業(yè)務(wù)是我們這邊的表和里,以及技術(shù)的戰(zhàn)略點(diǎn)。兩一其實(shí)就是我們現(xiàn)在重點(diǎn)的兩個(gè)業(yè)務(wù)方向,具體來說就是,一個(gè)結(jié)合線下安全去做硬件的業(yè)務(wù)場景,以及在內(nèi)容分發(fā)層面上,去結(jié)合AI技術(shù),讓分發(fā)的一效率以及效果能夠達(dá)到最優(yōu)。具體來說的話,IT硬件這邊我們陸續(xù)也發(fā)布了很多產(chǎn)品,包括目前已經(jīng)有數(shù)百萬用戶的攝像頭,以及二三號零兒童手表。

而線上內(nèi)容分發(fā)這塊更是360的重中之重,因?yàn)檫@是360和所有互聯(lián)網(wǎng)公司的兵家必爭之地,所以在搜索短視頻業(yè)務(wù)直播以及信息流這塊,AI場景在里面起到了一個(gè)決定性的作用。而視頻大腦我們覺得是只作為中間的一個(gè)核心技術(shù)點(diǎn)和核心的技術(shù)方案產(chǎn)出,對這兩塊業(yè)務(wù)產(chǎn)生了一個(gè)巨大的一個(gè)推動(dòng)作用。首先硬件如果沒有智能,沒有對視頻和語音技術(shù)的理解,它其實(shí)就談不上跟傳統(tǒng)的智能硬件有區(qū)分性。而視頻分析又是去年的一個(gè)風(fēng)口,從短視頻到直播類產(chǎn)品,之后會有越來越多的互聯(lián)網(wǎng)內(nèi)容分發(fā)的產(chǎn)品,而AI在里面提供了一個(gè)決定性的作用。

視頻大腦的具象化表述

其實(shí)從過去兩三年以來的話,我們從AI或者說視頻分析的一個(gè)技術(shù)點(diǎn)輸出,到逐步轉(zhuǎn)化為解決方案的輸出。所謂技術(shù)點(diǎn)的輸出,更多是說我們常見的人工智能技術(shù)如何去幫助一個(gè)行業(yè),或者是一個(gè)新的業(yè)務(wù)能夠更多的去賦能。但是到現(xiàn)在這個(gè)階段,隨著行業(yè)的發(fā)展,它更多不只需要智能技術(shù),而更多是能夠提供一個(gè)完整的方案。所以針對我們內(nèi)部的一些業(yè)務(wù)線,我們做了很多基于視頻大腦的行業(yè)方案,包括安防、短視頻,端上的包括私有化。它結(jié)合了目前市面上普遍說的一些概念,包括云邊端一些場景,后面我會具體來去給大家介紹一下。

我們視頻大腦對短視頻做了一個(gè)完整方案。短視頻的生態(tài)是比較完整的,它從作者端的生產(chǎn)到需要作者和用戶的交互增強(qiáng)到上傳。平臺這邊需要對上傳的視頻進(jìn)行理解和分析,然后最后分發(fā),分發(fā)的效果最后又體現(xiàn)在生產(chǎn)這邊,這是一個(gè)完整的生態(tài)。

視頻大腦或者說視頻分析方面,我們做的每一個(gè)過程,每一個(gè)方案都是為了在每一個(gè)節(jié)點(diǎn)上產(chǎn)生巨大的推動(dòng)作用。比如說在生產(chǎn)和增強(qiáng)這一塊,它能夠產(chǎn)生出很多新的范式,新,是很多視頻的高生產(chǎn)工具,能夠幫助用戶和作者來更好的表達(dá)視頻展現(xiàn)方式。而短視頻內(nèi)容分析更是視頻網(wǎng)站或者說視頻APP的基本必需品,然后分發(fā)方面更多是結(jié)合推薦算法來做更多、更好、更有效率的分發(fā)效果。

我們這邊做的比較重要的一個(gè)事情是短視頻的視頻結(jié)構(gòu)化分析。通過對短視頻內(nèi)部進(jìn)行音視頻理解,來去達(dá)到更多結(jié)構(gòu)化內(nèi)容的產(chǎn)生。而結(jié)構(gòu)化內(nèi)容又是對視頻內(nèi)部的語音化標(biāo)簽和語義化內(nèi)容的語音化技術(shù)去達(dá)到一個(gè)效果。舉幾個(gè)它運(yùn)用的比較明確的場景,首先是內(nèi)容審核。眾所周知,內(nèi)容行業(yè)一個(gè)最大的風(fēng)險(xiǎn),或者說各個(gè)平臺方面最大的一個(gè)風(fēng)險(xiǎn):如何能夠正確的回應(yīng)政府的監(jiān)管問題。之前大家往往會重視說短視頻審核其實(shí)更多是提高效率問題,比如說每天上傳100萬的視頻,可能需要足夠的人力去審核,而機(jī)器可以作為輔助。

但是其實(shí)對于我們從業(yè)者來說,我們覺得準(zhǔn)確率是更重要的點(diǎn)。我們希望人工智能技術(shù)在里面所起到的作用,不單是能夠提高效率,更多是提高準(zhǔn)確度。如何提高準(zhǔn)確度?我們在內(nèi)部做的更多就是運(yùn)營和機(jī)器兩塊,達(dá)成的是并行審核的概念。準(zhǔn)確率的提升是相加的關(guān)系,而不是相乘的關(guān)系。

另外基于對視頻的內(nèi)容理解,我們能夠做到很多內(nèi)容的關(guān)聯(lián),能夠更快更高效地找到目標(biāo)用戶的興趣點(diǎn),從而為平臺方、平臺推送方提供方案。

另外介紹一下360內(nèi)部的安防監(jiān)控業(yè)務(wù)。360的安防監(jiān)控跟市面上的安防監(jiān)控可能有點(diǎn)不一樣,首先360內(nèi)部的安防監(jiān)控是TO C場景類的,所以其特點(diǎn)就是量很大。這個(gè)量大到什么程度?大概在一年前,我們的當(dāng)天在線用戶數(shù)基本上已經(jīng)達(dá)到了百萬級別,也就是說有100萬視頻實(shí)時(shí)地經(jīng)過我們的服務(wù)器。所以另外一個(gè)特點(diǎn)就是它是TO C類產(chǎn)品,必然其安防需求也是跟傳統(tǒng)的安防是不大一樣的。從內(nèi)部來說可能結(jié)合兩個(gè)點(diǎn),一個(gè)是叫安防到安心這么一個(gè)點(diǎn)來去做基本的話,包括了陌生人人臉識別。也包括了安心這一塊,作為每一個(gè)C端的用戶,他希望知道家里面一天的進(jìn)出了什么人,然后我們對一天的視頻進(jìn)行分析,是不是能夠告訴我一天內(nèi)家庭成員的整個(gè)畫像是什么樣子。

在這方面還有比如有些用戶更喜歡結(jié)合直播場景,跟家里的小孩有一些互動(dòng)。這方面我們也做了一些工作,包括檢測家人、智能自動(dòng)喚醒。更重要是我們擁有幾百萬的用戶,在自有數(shù)據(jù)上進(jìn)行的訓(xùn)練和達(dá)到的效果是行業(yè)里面很多企業(yè)都沒法做到的。我們曾經(jīng)做過一個(gè)實(shí)驗(yàn),怎么用共有的數(shù)據(jù)來去做所需模型和線上系統(tǒng)呢?它對人臉比對的準(zhǔn)確度可能只有78%,這是實(shí)際的家用場景中碰到的一個(gè)很大的問題,而結(jié)合我們私有數(shù)據(jù)來去做這些事情,我們最后的準(zhǔn)確效果能達(dá)到百分之九十八。

另外一塊想給大家介紹的是我們過去一年多做的事情——端上的AI特效平臺。這塊其實(shí)結(jié)合了挺多的技術(shù)點(diǎn),比如說人臉關(guān)鍵點(diǎn)定位。從目前來說的話,已經(jīng)達(dá)到207個(gè)點(diǎn)的關(guān)鍵點(diǎn),能夠在手機(jī)端移動(dòng)端達(dá)到實(shí)時(shí)的處理效果。另外它的一個(gè)最大的應(yīng)用場景是互聯(lián)網(wǎng),互娛這邊內(nèi)容上可能大家覺得不是特別有意思,就是說在直播的場景或者說在相機(jī)類場景,它結(jié)合一些主播或者視頻制作者的強(qiáng)互動(dòng),我們加上一些技術(shù)上的東西,比如說AI摳圖,比如說人臉的關(guān)鍵點(diǎn)定位,就能做出一些比較好玩的一些效果。

這塊是端上的一個(gè)平臺,重點(diǎn)在于強(qiáng)調(diào)人跟外界的交互,其中很重要的點(diǎn)就是人臉分析,目前在國內(nèi)外,最早的人臉標(biāo)準(zhǔn)庫,LFW達(dá)不到99.7%,在去年的3.15晚會上,結(jié)合360的這樣一個(gè)安全場景我們告訴大家,人臉驗(yàn)證這個(gè)事情其實(shí)還是有很多不可靠的因素。

在去年的晚會上,我們在現(xiàn)場實(shí)時(shí)地破解了人體活體驗(yàn)證這個(gè)經(jīng)常使用的功能。而剛剛講的更多是業(yè)務(wù)層面的東西,實(shí)際在360內(nèi)部,做人工智能研發(fā)還是有很多側(cè)重點(diǎn)的,比如說我們更多側(cè)重在小、快、準(zhǔn)三個(gè)點(diǎn)上去做小盒快,更多是說希望能夠設(shè)計(jì)好模型,它能夠在云端和移動(dòng)端,甚至在后面的邊緣端,達(dá)到比較好的效果和效率。線上速度快,這是一個(gè)更需要的東西。這塊我們和行業(yè)內(nèi)很多芯片廠商以及業(yè)內(nèi)人士一起結(jié)合方案去做這一塊,而預(yù)測權(quán)限技術(shù)是轉(zhuǎn)為深度模型的深度學(xué)習(xí),然后我們希望它能達(dá)到一個(gè)比較好的預(yù)測速度。

我們做人工智能算法也是希望有一些特點(diǎn),特點(diǎn)更多是兩方面,一方面我們希望在國際上的公平競賽上能夠得到大家的一些認(rèn)可。

在過去的八年間,360人工智能團(tuán)隊(duì)基本上已經(jīng)獲得了十次以上的冠軍或者提名獎(jiǎng),包括世界計(jì)算機(jī)視覺世界杯之稱的ImageNet,以及比較有名的Pascal競賽。另外在對于行業(yè)內(nèi)部的來說,或者對人工智能計(jì)算法上有一些原創(chuàng)性的貢獻(xiàn)。目前我們的兩項(xiàng)技術(shù)基本上已得到了廣泛的應(yīng)用,包括我們在14年提出一個(gè)叫NIM的網(wǎng)絡(luò),它目前基本上已經(jīng)成為一個(gè)所有做深度學(xué)習(xí)都會使用的標(biāo)準(zhǔn)算法,以及我們在去年使用的Dual Path Networks。在去年的時(shí)候我們也參加了ImageNet一個(gè)關(guān)于標(biāo)準(zhǔn)物體定位的競賽,并奪得冠軍。

標(biāo)準(zhǔn)物體定位是計(jì)算機(jī)視覺的一個(gè)最重要的任務(wù),它的目的是在通用的視頻或者圖像當(dāng)中,能夠找到通用的一些物體,它的類別數(shù)量可能有一千類以上。在去年我們參加這最后一場競賽的時(shí)候, Dual Path Networks獲得了三項(xiàng)比賽、14個(gè)指標(biāo),全部排在世界前三的結(jié)果。

最后總結(jié)一下,我們?yōu)槭裁从X得視頻大腦或者說視頻內(nèi)容分析是未來的趨勢,首先我們能看到兩大趨勢,就是IT智能硬件的設(shè)備數(shù)。目前視頻大腦或者視頻內(nèi)容分析能夠賦能很多一般硬件不能做的事情。另外一塊我們覺得在隨著4G和5G的普及,從過去一年的數(shù)據(jù)上來看,百分之七八十以上的互聯(lián)網(wǎng)流量已經(jīng)轉(zhuǎn)化為視頻數(shù)據(jù)。這個(gè)視頻數(shù)據(jù)需要有人去分析,需要有人去監(jiān)管,這樣自然就帶來了一個(gè)比較大的市場,而我們希望視頻大腦能夠解決這一塊。目前來說我們能做到的,或者說業(yè)內(nèi)我們能提供的,包括后續(xù)可能會向行業(yè)去開放的能力,包括短視頻內(nèi)容分析,我們已經(jīng)做到了一級的PGC視頻的處理。而安防監(jiān)控這邊的話,每天的人臉比對,并不是人臉檢測,是達(dá)到了百萬級的在線視頻,每天1.5億的API調(diào)用。另外端上智能這塊,我們也已經(jīng)開始向行業(yè)人士開放來進(jìn)行一個(gè)推廣,目前陸續(xù)有各大手機(jī)廠商也跟我們開始合作。好,今天我的分享到這兒結(jié)束,謝謝大家。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號