99.8%勝率突破最后的游戲高地:從“人工智障”到吊打玩家,AI又登頂一個領域


本文首發(fā)于公眾號?情報姬
未經授權禁止任何形式的轉載~
審核丨Louis 文丨淬火
排版丨泡泡
有沒有想過,和你對戰(zhàn)的操作像開掛、意識超前好幾輪、打法戰(zhàn)術流暢多變的王者級玩家,其實是人工智能?
我們聽過太多AI從“智障”水平慢慢逆襲,超越并碾壓人類的例子,在游戲領域也早就實現(xiàn)了。

谷歌旗下,曾因開發(fā)AlphaGo而聞名于世的人工智能前沿公司DeepMind最近又出新招,面向電子競技發(fā)起挑戰(zhàn)。
這款由DeepMind制作的人工智能AlphaStar問世后,已實現(xiàn)了擊敗99.8%的《星際爭霸》人類玩家的目標,并且在星際爭霸II的神族、人族和蟲族都達到了宗師級水平。研究成果都上了科學雜志《Nature》。

從結果上來說,AI這次又有了新突破,但想讓“智障”一樣的AI從0起步,征服絕大多數(shù)玩家,這在游戲領域也不是什么容易的事。
何況這次挑戰(zhàn)的還是《星際爭霸》。

作為一款即時戰(zhàn)略游戲,星際的復雜度、信息隱蔽性、操作復雜程度在電子競技領域一直是難上手游戲的代名詞——相比《英雄聯(lián)盟》、《王者榮耀》只需操縱1個英雄,星際200人口上限帶來的操作要求成倍增長,而宏觀上還要兼顧戰(zhàn)術打法...

可以說《星際爭霸》是最難的電子競技游戲。也正是因為其難度,星際爭霸也一直都是全世界AI團隊挑戰(zhàn)的試煉場之一。

這“最后一個游戲高地”,也已經被AI攻破了。

也正是因為星際這游戲太復雜,研發(fā)團隊準備了很多年,做了大量工作。

對AI來說,挑戰(zhàn)星際的困難點反而不在那眼花繚亂的操作要求上。
像職業(yè)選手訓練一樣,每次測試前,團隊都會給AlphaStar搞訓練計劃。不一樣的是,訓練選手們是為了提高反應力和精度,訓練Al是相反的。

在今年1月與職業(yè)玩家MANA和TLO的對戰(zhàn)中,AlphaStar的操作被精準的限制在了450APM(每分鐘操作次數(shù)),畢竟是AI,在這點上不能欺負人類玩家,不然就成開掛勝之不武了。
沒有迷霧全開,沒有爆發(fā)操作,AI戰(zhàn)勝人類靠的是宏觀和微觀的戰(zhàn)略決策。

團隊測試的時候還分了兩種情況:通知玩家對面是AI和隱瞞身份對戰(zhàn),也是為了保證公平。

仔細研究27天后,AlphaStar碾壓一切低級選手,并且在與高等級玩家的對抗中獲了90場61勝的好戰(zhàn)績。
在團隊DeepMind看來,打成這樣算成功了。

我們知道人工智能在快速發(fā)展,而在游戲領域,AI同樣早已翻山越嶺,不再是“人工智障”的大眾印象了。

“人工智障”愛醬
畢竟平時接觸的游戲里,帶電腦模式、人機對抗的AI要不是靠設定提高操作上限,基本都是新手們玩的。

更不要說游戲里傻乎乎的NPC們了...


而實際與印象是截然不同的——AI征服星際爭霸并不是始發(fā)站,而很可能是終點站了。
不少游戲已經倒在了AI的征途上,這里就有我們所熟知的《DOTA2》。

另一家大有來頭的人工智能研究公司,OpenAI,就是火星達人,特斯拉老板埃隆·馬斯克的AI公司,在dota2上早已完成了征服成就。

在2017年的dota2世界邀請賽上,OpenAI便已經在一場1v1表演賽中戰(zhàn)勝了Dota 2職業(yè)玩家Dendi(Danil Ishutin)。

之后升級版的OpenAI Five更是實現(xiàn)了“一個人就是一支隊伍”的超級游戲達人:五個獨立AI可以在沒有任何人類的統(tǒng)一指揮下進行比賽的團隊配合。
也就是說,AI早在17年就能做到蹲草叢、抱團推進、團戰(zhàn)等一系列操作了...

這已經達到了世界1%的人類玩家水平。

而在競技之外的其他類型的老游戲上,AI可想而知的吊打人類。
誕生于1984年的平臺游戲《蒙特祖瑪?shù)膹统稹罚园l(fā)售以來就以難度變態(tài)聞名,折磨了游戲玩家?guī)资辍?/p>
為了尋找寶石打開寶藏,玩家需要翻越各種布滿怪物和陷阱的房間。而游戲僅第一關就有24個房間。簡直是搞心態(tài)...

30年后的2015年,人類玩家在游戲中的平均得分也就4700分。
那么AI搞了多少分呢?
DeepMind團隊僅僅以一種可以從YouTube視頻中學習《蒙特祖瑪?shù)膹统稹吠娣ǖ臋C器模型(不就是云玩家嗎??)為基礎,就讓AI在游戲第一關中取得了38000分。

看看翻了十倍的記錄,人類是別想打破了:后來OpenAI團隊以74500分的成績反超過去了。
從《蒙特祖瑪?shù)膹统稹返健禗OTA》再到《星際爭霸》,這幾個人類玩家入門都很頭疼的游戲現(xiàn)在都成了AI訓練場...

這幾個游戲都被碾壓了,更不要提其他游戲了。
《任天堂明星大亂斗DX》曾是IBM超級電腦“深藍”的訓練選項。

還有《太空侵入者》等雅達利游戲。

《吃豆人》、《真人快打》等街機主打游戲。

甚至《憤怒的小鳥》等手機游戲都成了AI練級的地方。

學習游戲,打敗游戲,AI甚至還可以通過電子游戲來改變現(xiàn)實。
游戲《俠盜獵車手5》中,在預設的交通規(guī)則、物理法則以及道路規(guī)劃下,AI完全可以在一個完全虛擬的游戲中測試自動駕駛汽車算法。
這樣的方式不僅可以避免不必要的干擾,并保障安全,而且收集數(shù)據(jù)的速度也可以比現(xiàn)實實驗快一千倍。

2016年3月,頂尖圍棋棋手李世石與AlphaGo的總比分定格在1:4,次年5月,世界排名第一的圍棋大師柯潔0:3再次被AI打敗。
2017年12月,谷歌推出具備自主研究功能的AI:AutoML。而由它自主研發(fā)的子AI:NASNet,性能完勝其他人類造物。
2018年5月,谷歌公開宣布他們發(fā)明的人工智能已經可以預測病人是否會在住院后24小時內去世,準確率高達95%。
自AI在人類引以為傲的領域上戰(zhàn)勝人類,到機器甚至可以判斷一個人的生命,時間不走兩年。

人類從爬行的古猿逐步成長到現(xiàn)代,花去了500萬年的時間。而科技魔力下的AI也在以恐怖的速度進化,在人類的幫助下攻克一個又一個領域。

電影、游戲、動漫里講不完的AI故事,距離現(xiàn)實越來越進。


我們向往AI時代對人類未來生活的改變,也報有同樣程度的擔憂。
AI征服《星際爭霸》,登頂游戲,下一個挑戰(zhàn)又在哪里?
----?End?----

要是覺得文章還不錯 就戳這里關注姬吧~
情報姬?為二次元發(fā)聲!
掃描下方二維碼,獲取更多最新最熱的次元資訊!
