訂閱
糾錯(cuò)
加入自媒體

字節(jié)跳動(dòng)大模型遭實(shí)習(xí)生破壞?公司稱(chēng)損失上千萬(wàn)美元嚴(yán)重夸大

AI發(fā)展途中,哪怕是大廠的內(nèi)控制度仍需加強(qiáng) 

大模型也能被“投毒”? 

近日,有消息稱(chēng)字節(jié)跳動(dòng)發(fā)生大模型訓(xùn)練被實(shí)習(xí)生“投毒”事件。 

據(jù)流傳,該事件發(fā)生在字節(jié)跳動(dòng)商業(yè)化團(tuán)隊(duì),因?qū)嵙?xí)生田某某對(duì)團(tuán)隊(duì)資源分配不滿,利用HF(huggingface)的漏洞,通過(guò)共享模型注入破壞代碼,導(dǎo)致團(tuán)隊(duì)模型訓(xùn)練成果受損。消息稱(chēng)此次遭到入侵的代碼已注入8000多張卡,損失或達(dá)千萬(wàn)美元。 

而在19日下午,字節(jié)跳動(dòng)官方也出面進(jìn)行了澄清,表示有媒體稱(chēng)“字節(jié)跳動(dòng)大模型訓(xùn)練被實(shí)習(xí)生攻擊”,經(jīng)公司內(nèi)部核實(shí),確有商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí)生發(fā)生嚴(yán)重違紀(jì)行為,該實(shí)習(xí)生已被辭退。

 不過(guò),雖然有相關(guān)事件,但相關(guān)報(bào)道也存在部分夸大及失實(shí)信息,涉事實(shí)習(xí)生惡意干擾商業(yè)化技術(shù)團(tuán)隊(duì)研究項(xiàng)目的模型訓(xùn)練任務(wù),但并不影響商業(yè)化的正式項(xiàng)目及線上業(yè)務(wù),也不涉及字節(jié)跳動(dòng)大模型等其他業(yè)務(wù)。另外,網(wǎng)傳“涉及8000多卡、損失上千萬(wàn)美元”嚴(yán)重夸大。 

經(jīng)核實(shí),涉事人一直在商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí),并沒(méi)有AI Lab實(shí)習(xí)經(jīng)歷。其社交媒體個(gè)人簡(jiǎn)介及部分媒體報(bào)道有誤。據(jù)悉,該實(shí)習(xí)生已在8月被公司辭退。公司也將其行為同步給行業(yè)聯(lián)盟和所在學(xué)校,交由校方處理。 

但是,此事件也暴露出了字節(jié)跳動(dòng)技術(shù)訓(xùn)練中存在的安全管理問(wèn)題,包括權(quán)限隔離、共用代碼的審計(jì)等。據(jù)九派新聞報(bào)道,一位技術(shù)安全專(zhuān)家表示,HF漏洞產(chǎn)生肯定是單一性集中訓(xùn)練,公司既沒(méi)做權(quán)限隔離,也沒(méi)有做好共用代碼的審計(jì)。正常情況下,每次大的代碼變動(dòng)必須做審計(jì),無(wú)論誰(shuí)做操作都有痕跡記錄,一個(gè)人想動(dòng)代碼是不可能的。 

作者:楊啟隆

編輯:丁力 

       原文標(biāo)題 : 字節(jié)跳動(dòng)大模型遭實(shí)習(xí)生破壞?公司稱(chēng)損失上千萬(wàn)美元嚴(yán)重夸大

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)