訂閱
糾錯
加入自媒體

CCF最新分享:數(shù)據(jù)隱私保護(hù)下,AI大數(shù)據(jù)應(yīng)如何發(fā)展?

3月24日,由CCF主辦,微眾銀行及深圳大學(xué)微眾金融科技研究院協(xié)辦的“CCFTF14期研討會”在深圳大學(xué)舉辦,此次會議的主題為“聯(lián)邦學(xué)習(xí)技術(shù)及數(shù)據(jù)隱私保護(hù)”。

隨著國際國內(nèi)數(shù)據(jù)隱私保護(hù)成為新趨勢,數(shù)據(jù)共享變得更加困難,如何在保護(hù)數(shù)據(jù)隱私前提下開展AI大數(shù)據(jù)研究?“聯(lián)邦學(xué)習(xí)”可以打破“數(shù)據(jù)孤島”具體應(yīng)用在AI領(lǐng)域。聚焦“聯(lián)邦學(xué)習(xí)技術(shù)及數(shù)據(jù)隱私保護(hù)”,CCFTF 14期研討會邀請國際人工智能學(xué)會理事長、微眾銀行首席人工智能官楊強、南洋理工大學(xué)于涵教授、微眾銀行人工智能部高級研究員劉洋、京東城市計算事業(yè)部AI平臺部負(fù)責(zé)人張鈞波、北京觀韜中茂(上海)律師事務(wù)所合伙人王渝偉、第四范式聯(lián)合創(chuàng)始人、首席研究科學(xué)家陳雨強、微眾銀行人工智能部副總經(jīng)理陳天健與大家現(xiàn)場互動交流。

AI大數(shù)據(jù)面臨挑戰(zhàn),技術(shù)向善與遷移學(xué)習(xí)

我們知道,AI與各行業(yè)緊密結(jié)合,必將顯著改善社會生活,這是一種比較理想的狀態(tài),然而現(xiàn)實是AI系統(tǒng)仍有許多不盡如人意的地方。另外,社會對隱私保護(hù)和數(shù)據(jù)安全提出了更高的要求,這也給大數(shù)據(jù)研究及共享提出了新的挑戰(zhàn)。

競爭、安全及數(shù)據(jù)壁壘等因素造成所謂的“數(shù)據(jù)孤島”問題。在此背景下,遷移學(xué)習(xí)幫助更多領(lǐng)域建模,就像在數(shù)據(jù)集之間建立朋友圈,數(shù)據(jù)孤島問題得到有效解決。

AI向善與系統(tǒng)短板

AI向善,它能在普惠金融、普惠教育、普惠醫(yī)療、智慧城市、災(zāi)難營救、扶貧及農(nóng)業(yè)等領(lǐng)域發(fā)揮重要作用。

楊強教授表示:“AI向善(AI for good),這在國外很早就被提出來的概念。這個概念不僅僅是計算機領(lǐng)域的發(fā)展,也是社會的需求,最近大家比較關(guān)心的一個議題就是AI和社會的結(jié)合。AI作為一種工具,就像以前互聯(lián)網(wǎng)作為一種工具,加上一些傳統(tǒng)的只能少數(shù)人享受的領(lǐng)域,然后通過AI的手段對廣大的社會傳播,能夠讓普通人也能享受過去VIP享受的那一些特殊服務(wù),包括金融,所以這樣就產(chǎn)生了AI和普惠金融;AI和普惠教育,例如大學(xué)的高等教育,能不能讓所有人都能享受到。另外還有AI和普惠醫(yī)療、智慧城市、災(zāi)難營救,AI扶貧和農(nóng)業(yè)等方面!

AI若能與各行業(yè)緊密結(jié)合,必將顯著改善社會生活,這是一種比較理想的狀態(tài),然而現(xiàn)實是AI系統(tǒng)仍有許多不盡如人意的地方,例如AI系統(tǒng)的有偏性和AI系統(tǒng)與人類合作方面的問題。

“AI系統(tǒng)有偏性,根據(jù)我們交給AI系統(tǒng)的數(shù)據(jù),AI系統(tǒng)可以建立模型,但如果這個數(shù)據(jù)是有偏的,那么這個模型就會有偏性。另一個是AI系統(tǒng)和人類合作的問題,最近一個很大的事情是波音飛機自動駕駛系統(tǒng)和人類飛行員搶奪控制權(quán),不幸的是系統(tǒng)贏了,導(dǎo)致飛機墜毀,現(xiàn)在波音飛機停飛。這給我們一個很大的啟示,自動系統(tǒng)如果不能和人類有一個很好的交互,沒有以人為中心的設(shè)計,這個系統(tǒng)會是一個災(zāi)難!睏顝娊淌诒硎。

遷移學(xué)習(xí)解決“數(shù)據(jù)孤島”問題

目前,除AI系統(tǒng)自身的一些問題外,重視隱私保護(hù)和數(shù)據(jù)安全的新趨勢也給數(shù)據(jù)研究及共享帶來新的挑戰(zhàn)。

近年來,國際國內(nèi)對于隱私保護(hù)和數(shù)據(jù)安全的重視已成為重要趨勢。歐盟去年5月通過最新法案《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation, GDPR),對數(shù)據(jù)保護(hù)采取更嚴(yán)格的態(tài)度。同時,我國也在緊跟這些領(lǐng)域的法律和規(guī)范,自2017年《網(wǎng)絡(luò)安全法》通過以后,目前我國個人信息保護(hù)法已納入立法規(guī)劃,有望在2020年通過,這些都反映出數(shù)據(jù)保護(hù)與隱私安全越來越受到重視。

隨著隱私保護(hù)和重視數(shù)據(jù)安全成為新趨勢,數(shù)據(jù)研究及共享面臨更多問題。首先,由于競爭關(guān)系、安全問題、審批流程等因素,數(shù)據(jù)共享難度高。其次,數(shù)據(jù)在不同擁有方、云和端以及物聯(lián)網(wǎng)節(jié)點之間的流通存在著難以打破的壁壘,形成所謂的“數(shù)據(jù)孤島”問題。此外,即便不同行業(yè)之間有意愿交換數(shù)據(jù),也可能遭遇政策問責(zé)和競爭保護(hù),AI的大數(shù)據(jù)面臨重重挑戰(zhàn)。

雖然AI的大數(shù)據(jù)面臨重重挑戰(zhàn),但數(shù)據(jù)孤島并非不可解決!斑w移學(xué)習(xí)就是很好的解決方案。遷移學(xué)習(xí)是用一個成熟領(lǐng)域的數(shù)據(jù)和模型,通過知識遷移,幫助完成一個小數(shù)據(jù)建模。這樣通過關(guān)聯(lián)領(lǐng)域間的相似性,幫助更多領(lǐng)域建模,這就像在數(shù)據(jù)集之間建立朋友圈,數(shù)據(jù)孤島也能得到有效解決!睏顝娊淌诒硎。

數(shù)據(jù)共享與安全,聯(lián)邦學(xué)習(xí)的優(yōu)越性

此外,解決數(shù)據(jù)壁壘、“數(shù)據(jù)孤島”等問題的方法除遷移學(xué)習(xí)外,還有一個重要方法——“聯(lián)邦學(xué)習(xí)”。

谷歌公司率先提出了基于個人終端設(shè)備的“聯(lián)邦學(xué)習(xí)” (Federated Learning)算法框架!奥(lián)邦機器學(xué)習(xí)”(Federated Machine Learning)實際上是一種加密的分布式機器學(xué)習(xí)技術(shù),參與各方可以在不披露底層數(shù)據(jù)和底層數(shù)據(jù)的加密(混淆)形態(tài)的前提下共建模型。它可以實現(xiàn)各個企業(yè)的自有數(shù)據(jù)不出本地,通過加密機制下的參數(shù)交換方式,就能在不違反數(shù)據(jù)隱私法規(guī)情況下,建立一個虛擬的共有模型。在這樣一個機制下,參與各方的身份和地位相同,成功實現(xiàn)了打通“數(shù)據(jù)孤島”走向“共同發(fā)展”的目標(biāo)。

聯(lián)邦學(xué)習(xí)分為橫向聯(lián)邦和縱向聯(lián)邦,橫向聯(lián)邦數(shù)據(jù)方特征維度相同,縱向聯(lián)邦數(shù)據(jù)方樣本ID相同?v向聯(lián)邦學(xué)習(xí)的目標(biāo)是A方與B方聯(lián)合建立模型,并且假設(shè)只有一方有標(biāo)簽Y,兩方均不暴露數(shù)據(jù),但可能遇到的挑戰(zhàn)是只有X的一方?jīng)]有辦法建立模型,雙方不能交換共享數(shù)據(jù),最終要達(dá)到的預(yù)期為雙方俊獲得數(shù)據(jù)保護(hù)且模型無損失。

“通過縱向聯(lián)邦學(xué)習(xí),各方在隱私保護(hù)下進(jìn)行樣本ID匹配,每個參與方并不知道另一方的數(shù)據(jù)和特征,每個參與方只得到自己的自己側(cè)的模型參數(shù)(半?yún)?shù)),即滿足隱私保護(hù)的要求,又滿足數(shù)據(jù)遷移學(xué)習(xí)的目標(biāo)。聯(lián)邦學(xué)習(xí)希望在安全合規(guī)的基礎(chǔ)上達(dá)到防御攻擊、提高算法效率的目標(biāo)!眲⒀蟛┦勘硎。

基于此,微眾銀行AI團(tuán)隊提出了基于“聯(lián)邦學(xué)習(xí)”的系統(tǒng)性的通用解決方案,可以解決個人(to C)和公司間(to B)聯(lián)合建模的問題。此前,微眾銀行在城市管理的視覺應(yīng)用方面,與極視角聯(lián)合推出了聯(lián)邦視覺項目。

“傳統(tǒng)城市管理面臨標(biāo)簽數(shù)量少、數(shù)據(jù)分散,集中管理成本很高且模型更新和反饋存在離線延遲情況,聯(lián)邦視覺項目通過聯(lián)邦學(xué)習(xí)對模型提升率為15%,且模型效果無損失,這是聯(lián)邦學(xué)習(xí)應(yīng)用在物聯(lián)網(wǎng)領(lǐng)域的一大優(yōu)勢! 劉洋表示。

物聯(lián)網(wǎng)(IoT)是基于互聯(lián)網(wǎng)、傳統(tǒng)電信網(wǎng)等信息傳輸渠道,讓所有具備通信功能的獨立物體實現(xiàn)互聯(lián)互通的網(wǎng)絡(luò)。物聯(lián)網(wǎng)的應(yīng)用之一,是透過收集多個節(jié)點的小數(shù)據(jù),聚集成大數(shù)據(jù)來建立應(yīng)用模型。

而邊緣計算(Edge Computing)則致力于通過依靠集網(wǎng)絡(luò)、計算、存儲、應(yīng)用核心能力為一體的開放平臺,就近提供最近端服務(wù),從而產(chǎn)生更快的網(wǎng)絡(luò)服務(wù)響應(yīng),滿足不同行業(yè)的實時業(yè)務(wù)需求。

物聯(lián)網(wǎng)、邊緣計算和與人工智能 (AI) 的有機結(jié)合離不開分布式大數(shù)據(jù)的安全、合法的管理,聯(lián)邦學(xué)習(xí)助力IoT,實現(xiàn)大規(guī)模用戶在保護(hù)數(shù)據(jù)隱私下的協(xié)同學(xué)習(xí)。

1  2  下一頁>  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號