最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

《DOTA2》的AI是如何打敗頂級職業(yè)選手的?

2017-08-19 17:08 作者:游民星空官方  | 我要投稿

  會玩DOTA2,又看了今年Ti7比賽的玩家,肯定會對比賽其中一個環(huán)節(jié)印象深刻。《DOTA2》的N朝元老,NAVI和屠夫雙重代言人Dendi作為比賽的受邀嘉賓,在Ti現(xiàn)場與一家人工智能公司特地打造的超級AI,來了場令人窒息的中單SF對決。

  比賽的結(jié)局可能在不少人的意料之中,畢竟這是一場敢于在全球直播中表演的中單對決,只有足以匹敵職業(yè)選手水平的AI,才能站在這個全球DOTA2玩家共同矚目的舞臺正中;但整個比賽過程,幾乎出乎了所有玩家和職業(yè)選手的意料:由人工智能操控的SF并非完全依靠絕對精準(zhǔn)的數(shù)值計算,而是有所取舍地掌握并運(yùn)用了拉扯兵線、吸引/取消仇恨、越兵線壓制、打斷大藥,甚至騙補(bǔ)刀消耗這些游戲中的技巧。


這次人工智能是在云端與Dendi進(jìn)行的對決

  中單第二局,上一把輸?shù)舻腄endi在出兵后選擇故意放兵,用進(jìn)塔策略快速消耗第一波小兵,從而把第二波兵控制在己方坡上的策略,同時也在試探這個人工智能會如何應(yīng)對。而卡兵出門的人工智能在第一波地方小兵進(jìn)入一塔視野范圍之后,第一時間選擇放兵阻止對方進(jìn)塔。雖然這一舉動沒能成功阻止Dendi的妙招,但人工智能依然依靠操作和意識,將第二波小兵留在了優(yōu)勢地形,并一步步積累優(yōu)勢,贏得了這場人與人工智能比賽的勝利。這個名叫OPEN AI的超級人工智能的實(shí)際表現(xiàn),征服了眾多玩家和職業(yè)選手。

  幾乎每個DOTA玩家都有和自帶AI交手的經(jīng)歷,但面對這樣一個人工智能,每個人都能清楚地認(rèn)識到,它與以往的那些所謂“AI”完全不同。

OPEN AI

  與國際圍棋棋手對決而聲名鵲起的AlphaGo,從屬于谷歌DeepMind工作室。這家人工智能領(lǐng)域的明星,接受了業(yè)內(nèi)不少科技巨頭的注資,同時擔(dān)任特斯拉和SpaceX首席運(yùn)營官一職的著名商業(yè)人物埃隆?馬斯克也是它的早期投資人之一。它擊敗韓國圍棋冠軍李世石后,埃隆?馬斯克第一時間發(fā)推,贊揚(yáng)人工智能的發(fā)展成果。

  而在OPEN AI擊敗了Dendi之后,馬斯克在推特上這樣說道:“OpenAI第一次在電競比賽上完勝世界頂級選手,這可比象棋圍棋復(fù)雜多了”。OpenAI這家非盈利性質(zhì)的人工智能研究公司成立于2015年,而埃隆?馬斯克是正是它的聯(lián)席主席之一。

  在2016年12月,OpenAI發(fā)布了一個名叫“Universe”的AGI測試訓(xùn)練平臺,這個平臺的最終目的,是讓人工智能像人一樣使用計算機(jī)。在類型眾多、數(shù)量龐大的測試項(xiàng)目中,游戲占了相當(dāng)一個比重,從ATARI2600到近年的網(wǎng)頁游戲,甚至其中還包括我們?nèi)巳硕际熘摹禛TA5》。

  但回到Ti7上的中單SF對決,一些對這個AI的評價依然抱有爭議:人工智能與職業(yè)選手獲取信息的方式、量級是否相等?人工智能的反應(yīng)速度、實(shí)際操作是否被限制在于人類相同的范圍以內(nèi)?

這些公司的很多游戲都在Universe中進(jìn)行測試

  這是個很嚴(yán)峻的問題。如果人工智能是依據(jù)游戲后臺數(shù)據(jù)進(jìn)行分析操作,并運(yùn)用了遠(yuǎn)超人類的操作和反應(yīng)速度優(yōu)勢的話,人類可以說是沒有勝算的,這場對決就變得毫無意義。而這些問題,或許可以在Universe這一項(xiàng)目中得到解答。

  在Universe中,人工智能通過捕捉屏幕像素捕捉信息,并模擬鼠標(biāo)和鍵盤進(jìn)行實(shí)際操作,游戲屏幕被分為1024*768個緩沖區(qū)。以ATARI2600游戲?yàn)槔斯ぶ悄茉诰钟蚓W(wǎng)云端觀察每秒60幀游戲畫面后,存在20毫秒的觀察滯后,和10毫秒的行動滯后。而在公共互聯(lián)網(wǎng)中,幀數(shù)降低至20幀,觀察滯后80毫秒,行動滯后30毫秒。


  而人類一般的反應(yīng)速度是250毫秒,職業(yè)選手要更短一些。OpenAI在Dendi比賽結(jié)束之后有稱,人工智能的實(shí)際反應(yīng)和操作被限定在了人類合理范圍以內(nèi)。

  可與此同時,另一個問題也接踵而至。在比賽間隙,OpenAI一側(cè)透露人工智能僅僅訓(xùn)練SF中單有兩周左右,如此短暫時間里OpenAI已經(jīng)可以做到擊敗全球?qū)嵙λ阶罡叩穆殬I(yè)選手,但與此同時,DeepMind的AlphaGo訓(xùn)練《星際爭霸2》,卻僅僅到了“學(xué)會遇到危險飛起基地”的水平。兩者究竟有什么不同?

  近幾年來,人工智能得到了長足地進(jìn)步和發(fā)展?,F(xiàn)如今已經(jīng)可以做到看、聽、說、甚至學(xué)習(xí)生成文字、圖像、聲音,甚至打敗圍棋世界冠軍。但這在人工智能領(lǐng)域中,依然被稱作“狹義人工智能”——你可以賦予它某一個特定領(lǐng)域中遠(yuǎn)超于人類的能力,但它缺乏領(lǐng)域以外的合理執(zhí)行力:即使AlphaGo學(xué)會了如何下圍棋,但你無法讓它陪你玩其他游戲,它無法應(yīng)用現(xiàn)有經(jīng)驗(yàn)帶入新的嘗試中,只能以不斷試錯的方式去學(xué)習(xí)。

  以一個叫做《Montezuma's Revenge》的ATARI2600游戲?yàn)槔?,這款游戲中玩家需要控制角色,利用各種設(shè)施進(jìn)行移動,并躲避移動的頭骨,拿到過關(guān)鑰匙。人類玩家可以從畫面中瞬間識別目標(biāo)和危險,但是讓人工智能去嘗試,它無法一眼將頭骨視為阻止它過關(guān)的威脅只能通過無盡的試錯,才能找到正確的通關(guān)方式。

  為了讓人工智能能夠通過自我學(xué)習(xí)找到游戲目標(biāo),Universe嘗試讓人工智能去提取畫面中的獎勵機(jī)制。幸運(yùn)的是,很多老游戲都在畫面中有顯示分?jǐn)?shù)獎勵,這使得人工智能終于能在一些游戲中主動尋求到游戲目標(biāo),并完成游戲。

逐步走向成熟的DOTA2人工智能

  雖然OpenAI訓(xùn)練《DOTA2》人工智能進(jìn)行中單對抗只有兩個星期,但并不意味著這樣短的時間內(nèi)人工智能就能讀懂游戲。早在今年上半年,OpenAI項(xiàng)目組就開始讓人工智能學(xué)習(xí)《DOTA2》,經(jīng)過強(qiáng)化訓(xùn)練后,它在3月1日學(xué)會了用小黑放神牛的風(fēng)箏,并在4月份開始對抗真人玩家。

  《DOTA2》天梯玩家都有一個叫MMR的分?jǐn)?shù),這個分?jǐn)?shù)一定程度上體現(xiàn)出玩家在團(tuán)隊(duì)PVP對戰(zhàn)的實(shí)際水平,例如Arteezy是萬分大神,Sumail8300分,dendi7300分。有數(shù)據(jù)顯示,超過7500分的玩家數(shù)量僅占0.01%,有58%的玩家地獄3000分,15%的玩家低于1500分。進(jìn)入5月份,人工智能已經(jīng)能在真人對抗中迎戰(zhàn)1500分的玩家了。

  今年6月初,人工智能第一次擊敗了1500分玩家,并在月底把大部分3000分局的勝場掌握在自己手中。隨著訓(xùn)練不斷進(jìn)行,人工智能終于在7月初勉強(qiáng)拿下了一場7500分局的勝利。7月底,才開始OpenAI口中的那“兩個星期”的訓(xùn)練周期。

隨著訓(xùn)練,人工智能的勝率變得越來越高

  8月7日,人工智能依次以3:0、2:1和3:0分別擊敗了6200分的Blitz、8500分級的Pajkatt和8900分的CC&C。兩天后,人工智能又擊敗了萬分大神Arteezy,當(dāng)時這些選手一致認(rèn)為,Sumail能夠找出擊敗它的方法。

  在這幾天當(dāng)中,人工智能扔在不斷自我學(xué)習(xí)和進(jìn)化。8月9日,Sumail以2:1的分?jǐn)?shù)戰(zhàn)勝了人工智能,但一天以后,就吃了個0:6的大鴨蛋。


  在這一階段,一些奇招是可以打敗人工智能的。Pajkatt贏得那場,他通過快速合成魔棒,并適當(dāng)配合仙靈之火的瞬間回復(fù)方式,擊敗了人工智能。而經(jīng)過高達(dá)1000場線上測試后,OpenAI發(fā)現(xiàn)了幾個人工智能的漏洞:把兵線反復(fù)后拉到塔與塔之間,小兵清干凈后人工智能會被塔砸死;毒球+魂淚可以在開局制造非常大的移速優(yōu)勢,并可以快速拿到一血;出門學(xué)一級影壓,一些6000-7000分的玩家可以通過短時間內(nèi)的連續(xù)影壓帶走對方。

  當(dāng)然,OpenAI的訓(xùn)練絕非完全自主的,這些特殊戰(zhàn)術(shù)在之后都被放入了人工智能的訓(xùn)練單當(dāng)中。經(jīng)過一定訓(xùn)練后,人工智能甚至在遇到信使勾引的情況下,合理判斷是擊殺還是放棄。在自我學(xué)習(xí)和人工補(bǔ)足的協(xié)同下,最終使我們在Ti現(xiàn)場親眼目睹了那場比賽。

5V5還有多遠(yuǎn)?

  在戰(zhàn)勝Dendi后,OpenAI表達(dá)了希望能在明年表演一場職業(yè)隊(duì)伍VS人工智能的5V5比賽。當(dāng)然,這場比賽的根基,才剛剛開始搭建?!禗OTA2》每天有100萬場公開匹配局,每局的錄像都會在Valve服務(wù)器儲存兩個星期,OpenAI團(tuán)隊(duì)如今收集了超過580萬場超過45分鐘的高端局錄像,讓人工智能不斷模仿和學(xué)習(xí)。

《DOTA2》的AI是如何打敗頂級職業(yè)選手的?的評論 (共 條)

分享到微博請遵守國家法律
孝感市| 兴隆县| 湛江市| 新晃| 襄樊市| 彰化县| 淮阳县| 长岭县| 高安市| 花莲市| 洪雅县| 镇赉县| 铁岭县| 苏尼特左旗| 泌阳县| 于田县| 云和县| 洛浦县| 大兴区| 连江县| 孟州市| 商河县| 玉树县| 扎囊县| 景洪市| 九寨沟县| 类乌齐县| 凤凰县| 申扎县| 平遥县| 汉源县| 峨山| 大田县| 南川市| 探索| 珲春市| 丰镇市| 泗阳县| 丰城市| 沁源县| 河曲县|