游戲AI三大難:樣本大、成本高、靈活性差

DeepMind“入侵”安卓游戲了
?
繼攻克圍棋、《星際爭霸》后,DeepMind開始瞄準手游了。
5月初,DeepMind推出 AndroidEnv后,開始密集測試諸多手游。最新加入體驗挑戰(zhàn)的是安卓版《The Battle of Polytopia》,它由瑞典開發(fā)商Midjiwan 制作并發(fā)行,是一款回合制文明策略游戲。
游戲故事背景設定在一個奇異而又平坦的“方塊”星球。玩家可領導 12 個不同文明中的一個,擴張帝國、研究科技并成為整個星球的統(tǒng)治者來最終取得勝利。
游戲擁有單人和多人模式,最多可支持 12 名玩家。
目前,Midjiwan 正跟DeepMind合作,將《The Battle of Polytopia》集成到AndroidEnv中,成為后者一項常規(guī)任務。
?
大爆炸,變革性體驗要來了?
“我們發(fā)現這款游戲是一個特別有趣的挑戰(zhàn),因為它有許多功能,如處理長期規(guī)劃、不完善信息、多樣化 UI 元素和非確定性。”DeepMind 評論說。

針對本次合作,Midjiwan 總經理Christian L?vstedt則表示,DeepMind 是人工智能領域巨人般的存在,能擁有這樣強大的合作伙伴,并成為平臺一份子,我們感到非常自豪和興奮。
在Polytopia玩家群體中,不乏資深玩家。融入人工智能后,想必也會給玩家體驗帶來不一樣的變化。
AndroidEnv作為一個AI平臺,允許AI代理在游戲中自定義任務,比如尋找公園的方向、預定航班甚至于獲取最高分。
AI代理主要依據屏幕上顯示的圖像做出決策,它能像人類一樣通過觸摸屏和手勢進行操作。
理論上,AI能夠幫助開發(fā)者實現內容快速生成、自動生成劇情,乃至促進NPC智能化和多風化。
以騰訊AI Lab為例。在競技博弈AI方面,騰訊AI Lab推出了絕藝跟覺悟。前者主要涉及棋牌項目中的圍棋和麻將,完成從完全信息博弈到非完全信息博弈的拓展。
后者主要涉及到MOBA類手游《王者榮耀》及體育類的足球,分別在異構分布式multi-agent和更多智能體+長配合方面進行探索嘗試。
筆者獲悉,《王者榮耀》項目組一直在嘗試各種新玩法,但效果往往不盡如人意。意外的是,AI人機對戰(zhàn)參與率極高,超過10%的玩家。
這意味著,日活用戶達到大幾百萬。官方披露的數據顯示,AI覺悟挑戰(zhàn)共吸引超過數千萬玩家參與。
此外,基于AI對于游戲理解的專業(yè)策略分析和聲音文本的綜合體現,騰訊也推出了王者榮耀虛擬主播。
在美術資源方面,騰訊AI Lab涉及虛擬人和3D動作生成。據悉,內部團隊正在著手嘗試在動作生成方面得到更真實的游戲表現,使其適配各類動作、地形和突發(fā)情況。
?
?
機遇與挑戰(zhàn)并存?
看似變革性體驗背后,其實需要耗費大量成本。
一位兼具游戲跟AI背景的資深人士告訴筆者,AI的確可以有效提升游戲體驗。掣肘在于,樣本大、訓練成本高。
像《王者榮耀》這類大DAU,高流水競技性產品,固然可以一試。對于中型體量產品而言,往往不太劃算。
一位創(chuàng)業(yè)游戲公司高層說,小樣本模型效果不錯的話,拿幾千萬嘗試也不是沒有可能。換言之,大樣本模型,讓企業(yè)望而卻步。
眼下業(yè)界常討論AGI(通用人工智能),可產品靈活性仍是一大難題。
DeepMind遇到成本、靈活性困境,無疑最具代表性。
?

據估算,AlphaGo整體訓練成本高達3500萬美元,消耗能量足以支持12760個人類大腦在三天內不眠不休地工作。
在備受關注的《星際爭霸》項目上,DeepMind也遭遇了類似難題。
2019年2月28日凌晨,DeepMind旗下游戲AI AlphaStar,以5比0大比分,擊敗了世界上最強大的職業(yè)星際爭霸玩家之一。當時它被視為突破人類智力的最后陣地。
通常情況下,訓練AlphaStar需要使用Google v3 TPU,用以支撐數千個《星際爭霸II》協同運行。
AlphaStar共對戰(zhàn)14天,每個代理使用16個TPU。在培訓期間,每個智能體都經歷了長達200年的實時游戲。
粗略估算下來,訓練成本達到數百萬美元。拋開成本不談,AlphaStar靈活性亦備受質疑。
紐約大學心理學系教授Gary F. Marcus認為,上述方案限制重重。在單一地圖上使用同一“種族”進行對戰(zhàn)時,其成績確實優(yōu)于人類。
不過一旦在其它地圖使用不同“種族”時,表現就要差很多。要想切換操作風格,必須得從頭開始重新訓練AlphaStar。
簡言之,即系統(tǒng)缺乏足夠的靈活性。這一特性會讓DeepMind訓練成本迅速放大。
數據不會說謊。根據去年年底DeepMind向英國公司注冊局備案提交的最新財務報告。
報告顯示,近三年DeepMind虧損額分別為4.77億英鎊(2019);4.702億英鎊 (2018);3.02億英礡(2017)。
營收方面,2019年DeepMind收入達2.66億英鎊;2018年達到1.03億英鎊;2017年營收為5442萬英鎊。
綜合近三年業(yè)績表現,不難發(fā)現DeepMind營收確系穩(wěn)步增長,虧損敞口逐步收小。不過需要指出的是,DeepMind大部分客戶依賴于母公司Alphabet旗下關聯公司。
某種程度上,這也說明DeepMind商業(yè)化還有非常高的提升空間。AI龍頭企業(yè)尚且如此,國內AI游戲廠商估計也大差不差。
只有有效解決樣本、成本、靈活性等問題,AI游戲才會真正大爆發(fā)。