科普小窗口 | 第七帖 人機(jī)大戰(zhàn)——星際爭霸
初原載于 機(jī)電科協(xié) 北工大機(jī)電圈子????
未進(jìn)允許禁止轉(zhuǎn)載

世界首次《星際爭霸》人機(jī)大戰(zhàn)
人類選手 4-0 完勝

新聞概要
10月31日,職業(yè)選手宋炳具(Song Byung-gu)在《星際爭霸》(Starcraft)直播競賽中擊敗了 4 個(gè)不同的 AI 對(duì)手,贏得 500 萬韓元獎(jiǎng)金(約合人民幣3萬元)!其中一個(gè)游戲人能“CherryPi”是由 Facebook 的 AI 實(shí)驗(yàn)室開發(fā)的。其余三個(gè)分別是來自韓國世宗大學(xué)的 MJ Bot、來自澳大利亞的 ZZZK、來自挪威的 TSCMOO。



雖然這次比賽不像 AlphaGo 與人類圍棋冠軍之間的世紀(jì)之戰(zhàn)那樣引起全球關(guān)注,但它仍具有重要意義。因?yàn)?AI 界認(rèn)為,人工智能要掌握《星際爭霸》異常困難。去年,AlphaGo 以壓倒性優(yōu)勢戰(zhàn)勝李世乭之后,AI 又在國際象棋和雅達(dá)利(Atari)的游戲中有所斬獲,人們開始將注意力轉(zhuǎn)移到《星際爭霸》這類即時(shí)戰(zhàn)略游戲上。
《星際爭霸》不同于圍棋,會(huì)設(shè)置戰(zhàn)爭迷霧,使玩家無法看到戰(zhàn)場全貌,這就要求人類選手或 AI 都必須具備預(yù)測戰(zhàn)場態(tài)勢和提前制定策略的能力。也正因此,《星際爭霸》被視為 AI 進(jìn)階的跳板。
但顯然這一次宋炳具是使 AI 打敗人類的幻想破滅了,作為世界頂級(jí)的《星際爭霸》選手,他在比賽中擊敗 4 個(gè) AI 總共用時(shí) 27 分種(最長用時(shí)十分半,最短四分半)。雖然人工智能操作速度更快,還能同時(shí)執(zhí)行多個(gè)任務(wù),但它們?nèi)匀徊皇侨祟愅婕业膶?duì)手。挪威的人工智能 TSCMOO 最快時(shí)能在一分鐘內(nèi)完成 19000 次操作,與之相比,大多數(shù)職業(yè)玩家一分鐘完成的操作最快也不過 300 次。
宋炳具接受采訪時(shí)這樣講:
“職業(yè)玩家只要一有機(jī)會(huì)就會(huì)立即發(fā)動(dòng)進(jìn)攻,相反,人工智能為了保存實(shí)力,不敢冒任何風(fēng)險(xiǎn)。”“我進(jìn)攻時(shí),它們?cè)诓挤赖倪^程中管理部隊(duì)的操作很令人震驚?!?/span>
世宗大學(xué)計(jì)算機(jī)工程教授 Kim Kyung-joong 認(rèn)為,人工智能由于缺乏有關(guān)《星際爭霸》的訓(xùn)練數(shù)據(jù)而使得發(fā)揮極大受限。還有專家預(yù)測,一旦訓(xùn)練得當(dāng),游戲人工智能將足以擊敗職業(yè)《星際爭霸》玩家。
知識(shí)科普
那么下面讓小編給大家講一下星際爭霸的知識(shí)吧
1、銷量領(lǐng)先,風(fēng)靡全球
? ? ? ? 《星際爭霸》是暴雪娛樂(Blizzard Entertainment)在 1998 年推出的游戲,當(dāng)年售出 150 萬套,并且成為電競領(lǐng)域的先驅(qū)游戲,10 年內(nèi)總銷售量則超過 950 萬套,到了 2010 年發(fā)行的《星際爭霸 II》,48 小時(shí)內(nèi)就賣出 150 萬套,打破了即時(shí)戰(zhàn)略類游戲的銷售記錄。
2、劇情設(shè)計(jì),別出心裁
? ? ?? 劇情時(shí)空設(shè)定在 26 世紀(jì),由三個(gè)種族包括地球人后裔人族 Terran、蟲族 Zerg、神族 Protoss,以在銀河系中心爭奪霸權(quán),揭開游戲的序幕。
號(hào)?外
DeepMind 和暴雪娛樂聯(lián)合公布了《星海爭霸 II》用于訓(xùn)練 AI 的工具

今年八月 DeepMind 和暴雪娛樂聯(lián)合公布了《星海爭霸 II》用于訓(xùn)練 AI 的工具,包含機(jī)器學(xué)習(xí)應(yīng)用程序界面(API)、多達(dá) 65000 場《星海爭霸 II》比賽的視頻以及開源工具等,后續(xù)每月還會(huì)增加比賽視頻,讓 AI 學(xué)習(xí)人類玩家的戰(zhàn)術(shù),他們也把特定游戲元素拆為迷你游戲,例如地圖探索、資源收集等,幫助 AI 訓(xùn)練特定技能。
之所以選擇《星際爭霸 II》,除了游戲本身的高人氣之外,最重要的原因就是內(nèi)容的復(fù)雜性,有三個(gè)特點(diǎn),分別是信息不完整、資源管理、即時(shí)性。
而在圍棋比賽中,選手所觀察的范圍完全只在那一塊棋盤上,所以人工智能思考的決策尺度在數(shù)百步之內(nèi)??墒?,游戲的困難度高出太多,特別是即時(shí)戰(zhàn)略游戲,玩家必須展開長時(shí)間尺度的綜合性策略,而且玩家只能在自己的單位范圍內(nèi)看到地圖,無法同時(shí)看到整個(gè)比賽場景,也就是信息不完整的環(huán)境,必須靠記憶來記得對(duì)手的操作,但游戲進(jìn)行的同時(shí),對(duì)手也在玩,狀況是變動(dòng)性而非永久不變的,也考驗(yàn)玩家根據(jù)新情況來調(diào)整計(jì)劃的能力。

再加上,游戲涉及采集資源、生產(chǎn)兵力等經(jīng)濟(jì)規(guī)劃,考驗(yàn)玩家長遠(yuǎn)的謀略及技巧,因此被視為是 AI 訓(xùn)練的最佳領(lǐng)域,一但突破,AI 發(fā)展將來到一個(gè)新的里程碑。

?不過,就像 AlphaGo 在打敗人類棋王之前,許多人不認(rèn)為機(jī)器會(huì)獲勝,但也有人覺得機(jī)器勝算大,現(xiàn)在在游戲領(lǐng)域也有分歧的看法,“我不認(rèn)為 AI 可以打敗職業(yè)玩家,至少在我有生之前看不到?!蹦孟?2016 年《星際爭霸 II》WCS 世界錦標(biāo)賽冠軍的韓國電競高手 Byun Hyun Woo,先前接受《麻省理工科技評(píng)論》專訪時(shí)這么說。他進(jìn)一步解釋,《星際爭霸》屬于即時(shí)戰(zhàn)略游戲,必須對(duì)許多不確定性和變因做出很快的反應(yīng),但 AI 似乎仍不擅長應(yīng)對(duì)意想不到的狀況,另一個(gè)原因則是長期策略,“要打造一個(gè)能同時(shí)擅長做短期跟長期決策的 AI 太難了?!?/p>
大新聞來嘍
2018年1月28-30日,DeepMind將在“EmTechChina全球新興科技峰會(huì)”上給《星際爭霸》的電競高手來場震撼教育。讓我們拭目以待。

文字:double男人&佳潔士AD鈣
排版:龍川、韓佳琪
校對(duì):盧思嘉
