人工智能再一次戰(zhàn)勝了人類:這一次是電子游戲
這兩天,一條消息在電競?cè)涂萍既Ρ耍?/p>
艾隆·馬斯克創(chuàng)立的人工智能公司宣布:他們研發(fā)AI已經(jīng)在游戲里擊敗世界排名前1%的人類玩家了!

與OpenAI Five進(jìn)行比賽的人類選手
人類又雙叒叕輸給AI了????

這事,咱們從頭說起。
首先呢,這個OpenAI是大有來頭,它是特拉斯的創(chuàng)始人,艾隆·馬斯克創(chuàng)立的,一家非營利性的人工智能研究公司。

然后,AI完虐人類的這場比賽比的是DOTA2。
有一些不玩游戲不氪金的朋友可能不了解,DOTA算是目前電競界最受關(guān)注的電子競技項目之一,今年DOTA2世界邀請賽的獎金額度已經(jīng)超過了1500萬美元!

這個游戲規(guī)則是這樣:五對五多人在線競技類,在游戲中每支隊伍需要守衛(wèi)己方的防御塔,并伺機(jī)破壞敵方的防御塔。
也就是說一局游戲里,十名玩家各自獨(dú)立控制一個角色,也就是游戲里所說的英雄。

在游戲中每一個英雄都有獨(dú)特的能力和不同的游戲風(fēng)格,率先摧毀位于敵方基地的大型防御塔,就算獲勝。
游戲還囊括了裝備購買、角色升級、技能微操等諸多機(jī)制,玩家要在有限信息下對場上局勢的判斷與預(yù)測,還有戰(zhàn)略上的抉擇。
不止如此,作為一款團(tuán)隊協(xié)同游戲,電子競技與之前AI們戰(zhàn)勝人類的領(lǐng)域——如圍棋和象棋這樣單獨(dú)作戰(zhàn)的比賽還是有很大的不同。
五個英雄需要相互配合,針對于個人利益與團(tuán)體利益做出取舍,既考驗玩家個人操作能力,又考驗全局觀和團(tuán)隊配合。

dota2地圖
其實早在去年的國際 Dota 2邀請賽中,OpenAI就已經(jīng)在一場1v1表演賽中戰(zhàn)勝了Dota 2職業(yè)玩家Dendi(Danil Ishutin)。

2017年dota2世界邀請賽 ,Dendi與OpenAI進(jìn)行1V1對抗
而在最近這場比賽,最新升級版的OpenAI Five隊伍,是五個獨(dú)立AI在沒有人統(tǒng)一指揮的情況下進(jìn)行團(tuán)隊配合。
OpenAI Five具有一種被稱為“團(tuán)隊精神team spirit”的超參數(shù),用于判斷個利益能與團(tuán)隊利益之間的平衡
換句話說:團(tuán)魂、配合這種,我們以為人類才會有的精神也好意識也好,也被算法化了……
OpenAI Five的人工智能學(xué)習(xí)基于“強(qiáng)化學(xué)習(xí)reinforcement learning”理論,讓機(jī)器在環(huán)境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預(yù)期,產(chǎn)生能獲得最大利益的習(xí)慣性行為。

強(qiáng)化學(xué)習(xí)
這種學(xué)習(xí)模式使得AI得以在有限信息下對未來多種可能性進(jìn)行分析,并作出選擇。借助256塊顯卡以及128000塊CPU的強(qiáng)大處理能力,它可以每天進(jìn)行180年的游戲時間,通過不停與自己比賽來學(xué)習(xí)DOTA2。
嗯,人家練一天,相當(dāng)于人類練180年……怎么比,你說怎么比?

OpenAI對老游戲進(jìn)行的學(xué)習(xí)過程,可以看到經(jīng)過120分鐘的學(xué)習(xí)之后,AI可以很熟練地掌握游戲玩法。
從OpenAI發(fā)布的視頻中可以看到由AI操控的角色會預(yù)判對手的逃跑軌跡并進(jìn)行追擊,并以自身為誘餌,吸引對手進(jìn)入我方的包圍圈。
這種程度的團(tuán)隊配合,一般只有老司機(jī)才可以玩的得心應(yīng)手, OpenAI Five的團(tuán)隊意識,已經(jīng)超過了絕大多數(shù)路人局里你會遇到的隊友。
不過,大家現(xiàn)在也不用太絕望了。
目前OpenAI Five也不是完美無缺,AI只學(xué)習(xí)了5種游戲角色的使用方法,在道具的使用上也非常有限。

DOTA2游戲角色
另外也有網(wǎng)友指出,機(jī)器人在對陣人類時有一種不可避免的優(yōu)勢:它們的操作輸入會比人類更快。理論上OpenAI每分鐘可以進(jìn)行450次操作。
這也是去年OpenAI可以在1v1中戰(zhàn)勝BENDI的原因, 但在更考驗戰(zhàn)略意識的5v5戰(zhàn)中,AI暫時還不足以戰(zhàn)勝人類。
第八屆國際DOTA2邀請賽將于八月舉行,屆時OpenAI團(tuán)隊將派出自己的AI站隊挑戰(zhàn)DOTA2最強(qiáng)的專業(yè)玩家。
瘋狂訓(xùn)練以后的AI戰(zhàn)隊,會不會立斬人類于馬下?我不敢去預(yù)測最后的答案...
雖然我們已經(jīng)無數(shù)次地在談?wù)揂I戰(zhàn)勝人類,但再一次回首人工智能的進(jìn)化史,這兩年AI的迅猛進(jìn)化,還是會讓人心中生起一陣恐懼。
2017年5月,世界排名第一的柯潔九段與AlphaGo對弈,0:3完敗。
在賽后,柯潔坦言:“AlphaGo實在太完美,沒有任何缺陷,沒有心態(tài)波動,他看不到任何勝利的希望?!?/strong>
AI,已經(jīng)是黑白棋盤里的上帝。

2017年6月,美國羅格斯大學(xué)研發(fā)的AI:GANs,根據(jù)超過8萬幅畫作和不同藝術(shù)家風(fēng)格的數(shù)據(jù),對算法進(jìn)行訓(xùn)練,現(xiàn)在它已經(jīng)像畢加索那樣去畫畫。
當(dāng)把這些AI作品和一些博物館藏品放在一起,人們已經(jīng)無法分辨出,哪些是人類用靈感繪制的畫作,哪些是機(jī)器根據(jù)算法產(chǎn)出的作品。
AI,已經(jīng)打破了藝術(shù)只能由人類創(chuàng)造的想法。

2017年12月,谷歌大腦推出了可自主研究AI的AI:AutoML,自動機(jī)器學(xué)習(xí)。它最大的突破性在于,它是一款可以自足制造其他人工智能的AI。
而它自主孕育的第一個孩子,子AI:“NASNet”,在后續(xù)的測試表現(xiàn)中,完勝所有人類設(shè)計的AI。
AI,已經(jīng)能挑戰(zhàn)它的創(chuàng)造者們。

NASNet架構(gòu)分為正常層(左側(cè))和縮小層(右側(cè)),均由AutoML設(shè)計
2018年6月,IBM最新人工智能系統(tǒng),Project Debater在一場辯論賽中,戰(zhàn)勝了兩位國家級的專業(yè)辯論專家。
它通過處理海量文本數(shù)據(jù),不帶感情和偏見地寫出有理有據(jù)的辯論稿,憑借豐富的信息碾壓了人類辯手。
AI,在本屬于人類的思辨游戲上發(fā)起進(jìn)攻。

2018年5月,谷歌在《自然》上發(fā)文宣布:它開發(fā)的人工智能可以預(yù)測醫(yī)院病人是否會在入院后24小時內(nèi)過世,準(zhǔn)確率達(dá)到了95%。
在我們?nèi)パ鲑嚈C(jī)器判斷一個人的生與死的時候,我們是把生命的權(quán)力交給人工智能。

Google AI在預(yù)測死亡率方面的表現(xiàn)(實線)與兩家醫(yī)院的基線計算機(jī)模型(虛線)相比較
一次又一次,在大部分人還困于現(xiàn)實,掙扎著前行,科技以讓人心生恐懼的速度在飛速發(fā)展,更新迭代。
霍金在2017年的一次講座中曾經(jīng)提到“理論上,計算機(jī)可以模擬人類的智能,并超越人類?!?/strong>
《人類簡史》的作者,以色列學(xué)者,赫拉利預(yù)言,隨著人工智能的發(fā)展,科技的進(jìn)步,現(xiàn)在處于地球金字塔頂端的,智人(Homo sapiens)將被“智神”(homo deus)所取代。
“這是一個最好的時代,這是一個最壞的時代; 這是一個智慧的年代,這是一個愚蠢的年代; 人們面前應(yīng)有盡有,人們面前一無所有;人們正踏上天堂之路,人們正走向地獄之門。”
我們用了五百萬年,從猩猩進(jìn)化成智人。
AI,從一片混沌到可以取代我們,可能就在下個,下下個世紀(jì)。

AI時代,你真的準(zhǔn)備好了嗎?