訂閱
糾錯(cuò)
加入自媒體

一天等于兩百年?人工智能在星際爭(zhēng)霸2上向人類發(fā)出挑戰(zhàn)

2019-01-26 08:46
張康康
關(guān)注

一天等于兩百年?人工智能在星際爭(zhēng)霸2上向人類發(fā)出挑戰(zhàn)

今天,一則《Deepmind公布星際爭(zhēng)霸2結(jié)果:AlphaStar以10:1戰(zhàn)勝職業(yè)高手》一文,引發(fā)熱議,但是其實(shí)在兩年前,AI就與人類選手進(jìn)行過星際爭(zhēng)霸比賽。

2017年,世界首屆人類與星際爭(zhēng)霸AI對(duì)抗賽上,在接連兩位學(xué)生選手?jǐn)≡贏I手上后,韓國(guó)著名星際爭(zhēng)霸選手、星際四皇“司令”Stork通過四場(chǎng)連勝將AI打敗。他打敗的AI包括了Facebook開發(fā)的CherryPi和來自澳大利亞、挪威和韓國(guó)的AI。

一天等于兩百年?人工智能在星際爭(zhēng)霸2上向人類發(fā)出挑戰(zhàn)

而在兩年后的今天凌晨,DeepMind公布了其錄制的AI在星際爭(zhēng)霸2中與兩位職業(yè)選手的比賽,AlphaStar以5:0的成績(jī)戰(zhàn)勝了2018年WSC奧斯汀站的亞軍MaNa。除了此前比賽錄像的展示外,AlphaStar還與MaNa現(xiàn)場(chǎng)對(duì)戰(zhàn)一局,不過這局AlphaStar輸給了人類選手。

DeepMind的研究聯(lián)合負(fù)責(zé)人David Silver在賽后表示,“人工智能的歷史被打上了許多重大的標(biāo)桿性勝利的印記。我希望,未來的人們可能會(huì)回顧今天,或許會(huì)認(rèn)為這是人工智能系統(tǒng)所能做的又向前邁進(jìn)了一步。”

2013年,當(dāng)時(shí)名不見經(jīng)傳的在DeepMind發(fā)表了一篇論文,內(nèi)容是他們自己開發(fā)的AI游戲系統(tǒng)。論文中描述的計(jì)算網(wǎng)絡(luò)并不是為了游戲而服務(wù),反而是讓一個(gè)AI系統(tǒng)自己去玩游戲。神奇的是,DeepMind的游戲系統(tǒng)可以在完全沒有接觸的前提下,通過對(duì)游戲的自我學(xué)習(xí),自動(dòng)的玩一系列初級(jí)電視游戲。

這個(gè)系統(tǒng)可以通過屏幕上面的圖像和游戲中的分?jǐn)?shù)是否上升下降,從而做出選擇性的動(dòng)作。雖然這個(gè)行為對(duì)人來來說難度不大,但對(duì)于機(jī)器學(xué)習(xí)來說卻意義驚人。因?yàn)樗婕凹茉O(shè)任務(wù)、建立人工精神網(wǎng)絡(luò)、建立深度學(xué)習(xí)模型和完善學(xué)習(xí)過程幾個(gè)關(guān)鍵部分,并且需要大量的圖形處理單來輔助。

星際爭(zhēng)霸2這樣的游戲其實(shí)比棋盤類游戲更難玩。在電子游戲中,人工智能無法通過觀察每一塊棋子的移動(dòng)來計(jì)算下一步棋,它們必須實(shí)時(shí)做出反應(yīng)。星際爭(zhēng)霸2的不可預(yù)測(cè)性遠(yuǎn)大于圍棋,玩家可以在同一時(shí)間會(huì)有300種基本動(dòng)作可選擇,即使在一個(gè)84x84像素的屏幕中,也會(huì)產(chǎn)生大約1億個(gè)不同的動(dòng)作,因此DeepMind要收集大量玩家的數(shù)據(jù)進(jìn)行分析。

目前DeepMind要做的是讓AI預(yù)測(cè)人類玩家下一步會(huì)做什么,AI在比賽之前僅僅數(shù)天的訓(xùn)練量,相當(dāng)于職業(yè)選手訓(xùn)練200年之長(zhǎng),同時(shí)在對(duì)游戲單位的操作上,AI可以避免人類選手的微操失誤,同時(shí)對(duì)未知地形進(jìn)行勘探,在應(yīng)對(duì)突發(fā)狀況時(shí),AI的會(huì)選擇最好的處理方式。還有當(dāng)人類玩家做了這些操作后要如何應(yīng)對(duì),通過局勢(shì)判斷下一步要干什么。暴雪已經(jīng)承諾會(huì)從星際2的天梯中收集數(shù)十萬個(gè)匿名錄像幫助DeepMind訓(xùn)練,這樣可以讓AI做到序列預(yù)測(cè)和長(zhǎng)期記憶。

AI的學(xué)習(xí)遠(yuǎn)遠(yuǎn)超過了我們的想象,無數(shù)企業(yè)也在不斷加碼人工智能,BAT、曠視科技、商湯科技、極鏈科技Video++、依圖科技這些深耕人工智能領(lǐng)域的企業(yè),也都在不斷進(jìn)行人工智能各方面的深度學(xué)習(xí)。不得不感嘆于AI在電子競(jìng)技項(xiàng)目進(jìn)步的速度,人工智能下一步的目標(biāo),或許就是想向更多的專業(yè)游戲選手發(fā)出挑戰(zhàn)。從人工智能首次被提出來,到現(xiàn)在逐漸進(jìn)入我們的生活,未來的某一天,AI對(duì)于人類也將不再是一項(xiàng)觸碰不到的技術(shù)。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)