AI和游戲產(chǎn)業(yè)的蜜月期,竟然是從我的世界開始的
踏入了一個新的礦洞,你用火把照亮前方的黑暗,手上緊握著木制鎬頭的同時心中充滿著期待。
又一個挑戰(zhàn)即將開始,身為玩家的你清楚這不僅僅是游戲,這更像是一場探索未知的冒險,這是一種發(fā)自內(nèi)心的呼喚,一種內(nèi)在的渴望驅(qū)使你去構(gòu)建、去創(chuàng)新、去探索——你正沉浸在《我的世界》中。
然而你可能并不知道這個游戲世界的另一面。這里此時已經(jīng)成為了人工智能(AI)技術(shù)研究的一個試驗場,此時“你”的身份,可能是名為“AI”的一行代碼。
——是的,你沒有聽錯,《我的世界》已經(jīng)成為了AI研究者們的新藍海。
就在最近,英偉達和國內(nèi)的幾家權(quán)威科研機構(gòu)分別對于“AI玩我的世界”這件事發(fā)布了相關(guān)論文,并介紹了兩位全新面世的AI選手。
第一位選手是英偉達最近開發(fā)的游戲AI智能體VOYAGER,它將目前大家聊得最火熱的AI大模型GPT-4接入了《我的世界》,基于GPT-4的強大能力,它能夠在《我的世界》里自主完成建造房屋、挖礦、應(yīng)對敵人等等基本的一些生存技能,也可能進行開放式探索,去到不同的村莊神廟,哪怕要去的地方需要一個傳送門,它也能輕松解決。
涉及論文的專業(yè)單詞,獺水平有限,勉強翻一個標(biāo)題出來給大家理解意思
“Voyager:具備大型語言模型的開放式代理功能”
第二位選手則是商湯科技聯(lián)合清華大學(xué)、上海人工智能實驗室等機構(gòu)開發(fā)的Ghost in the Minecraft(以下簡稱為GITM)。它同樣選擇將大語言模型整合進《我的世界》,不過他選擇的是LLM。
GITM在《我的世界》成功通關(guān)并解鎖了完整的科技樹——在這之前所有的AI成績加一起也只能覆蓋30%。值得一提的是在“獲取鉆石”這個任務(wù)上,GITM成功率達67.5%,相比于此前的最佳成績——OpenAI的方法提高了足足47.5%。
“Minecraft 中的幽靈:通過具有基于文本的知識和記憶的大型語言模型為開放世界環(huán)境提供一般情況下的自動代理”
GITM的任務(wù)覆蓋率遠超同行
這個新賽道上的兩位明星選手在這個“全新的”沙盒游戲中接受挑戰(zhàn),而他們的AI在不斷地學(xué)習(xí)和進化,直到突破自我超越人類——事實上現(xiàn)在他們已經(jīng)可以完成人類玩家能完成的所有游戲目標(biāo)。
這時第一個問題出現(xiàn)了:為什么是《我的世界》?
《我的世界》與其他游戲最大的不同在于,這個游戲并沒有一個設(shè)定好的主線任務(wù),也沒有什么一定要完成的目標(biāo)。你可以在生存模式中自給自足,或者在創(chuàng)造模式中無拘無束地建造你的建筑或者世界。
比起固定規(guī)則的棋類游戲,或者是具有戰(zhàn)略的對戰(zhàn)游戲,像LOL和王者榮耀,《我的世界》的復(fù)雜程度和自由度更高,這對AI的學(xué)習(xí)和理解能力提出了更高的要求。
在DOTA2游戲中,AI曾向2018年TI8冠軍隊伍OG發(fā)起挑戰(zhàn)
盡管是表演賽,AI仍舊展現(xiàn)出了強大的統(tǒng)治能力,全勝獲得比賽勝利
王者榮耀kpl秋季賽上AI也曾和頂尖玩家組成的人類戰(zhàn)隊進行過測試
最終AI戰(zhàn)隊獲得勝利
這就是為什么英偉達和商湯科技選擇《我的世界》作為AI訓(xùn)練場地的原因,這款游戲的開放性和多變性,更加接近現(xiàn)實世界的環(huán)境,能夠幫助AI更好地理解和適應(yīng)各種環(huán)境變化,更深入地模擬和應(yīng)對人類在復(fù)雜問題上的能力。
不過不是所有的開放世界游戲都適合訓(xùn)練AI,參與開發(fā)了VOYAGER的英偉達首席科學(xué)家Jim Fan回應(yīng)了網(wǎng)友的疑問?!度麪栠_傳說 王國之淚》和《艾爾登法環(huán)》等游戲看上去雖然宏大,但因為研究者們很難用編程方式去控制游戲的高端控制臺所以不太合適。
相較之下,《我的世界》的技術(shù)門檻更低,為AI訓(xùn)練創(chuàng)造了更友好的環(huán)境。
但有一說一,獺還真想看看AI玩王淚是什么樣
那么AI在《我的世界》里究竟是如何學(xué)習(xí)和成長的呢?
以前,訓(xùn)練AI的主流方法是模仿學(xué)習(xí)和強化學(xué)習(xí)。舉個例子,如果你想讓AI學(xué)會挖礦,你首先需要給AI展示大量的挖礦視頻,讓它從中學(xué)習(xí),然后再讓AI實際上手操作,反復(fù)試錯,從而真正掌握挖礦這一技能。這種方法就像是在給AI上一門一對一的“挖礦指導(dǎo)課”。
一名研究員通過“強化學(xué)習(xí)”訓(xùn)練AI駕駛車輛通過連續(xù)的彎道
但是VOYAGER和GITM的開發(fā)者們打破了常規(guī),他們引入了大語言模型(LLM)作為AI訓(xùn)練的核心方法。
在這個方法下,AI的學(xué)習(xí)邏輯被完全重構(gòu)。我們還是以挖礦為例,AI智能體首先會自我提問,然后自動生成許多小任務(wù),例如找到能幫助挖礦的不同物品。然后AI會根據(jù)自己的實際操作和環(huán)境反饋,逐步建立起一個挖礦技能庫。
以后再遇到挖礦任務(wù),AI就可以直接從這個技能庫中檢索答案,而不需要像上面的賽車一樣反復(fù)對著場地外面沖鋒,因為AI早就已經(jīng)知道“我到場地邊緣會掉下去”。
如果這項技術(shù)可以普及,那么這種重復(fù)且利用率低的訓(xùn)練方式將會慢慢淘汰
也就是說這種大語言模型的訓(xùn)練方法可以讓AI自主驅(qū)動探索,從而掌握更加廣泛的技能。這也會讓AI比起現(xiàn)在的形態(tài)更像一個“學(xué)習(xí)者”,可以在一個相對較長的時間跨度中,慢慢地獲得、更新、積累和遷移所需要的知識。
而且這種方法還能緩解其他同類型的AI持續(xù)學(xué)習(xí)方法中的“災(zāi)難性遺忘”事件——通常這種事件被描述為這種情況:你訓(xùn)練了一個AI,但由于某些錯誤AI忘記了或覆蓋了先前的調(diào)教,一切從零開始。
ChatGPT能給用戶“有記憶”的感覺,是因為它每次對話時都會聯(lián)系上下文處理
一旦超過了它能處理的長度限制,GPT的“記憶”也就不復(fù)存在
這一點就好像是把AI這個學(xué)生從學(xué)校里放到了真實的社會里,讓它在實際的生活環(huán)境中學(xué)習(xí)與成長——這比純粹的課堂學(xué)習(xí)要更加生動和有效,也讓用大語言模型方法訓(xùn)練出來的AI更像一個真實的“人”。
事實上如果你留意的話就會發(fā)現(xiàn),《我的世界》里的AI已經(jīng)具有了很多人類的能力。
它能根據(jù)當(dāng)前的環(huán)境和自身技能提出合適的任務(wù),也可以根據(jù)環(huán)境反饋完善技能并將其存入記憶,它還能自我驅(qū)動,主動地探索世界,尋找新任務(wù)——這些都與人類的決策過程和行為方式非常相近。
AI可以應(yīng)對各種生物群落、環(huán)境、白天或黑夜場景,即便遇到怪物也游刃有余
《我的世界》可能已經(jīng)成為一個縮小版的現(xiàn)實世界,而AI正是在這個縮小版的現(xiàn)實世界中成長起來。
這個“成長”的周期可能比我們想象的還要長一點,盡管獺稱《我的世界》是AI訓(xùn)練者們的新藍海,但這只是指最近的爆發(fā)式的發(fā)表成果,早在2019年就有不少公司在這堆馬賽克組成的開放世界里調(diào)教AI了。
那時候還沒有崩的Facebook研發(fā)過一款《我的世界》專用AI 助手Craftassist Bot——一個智能協(xié)作式的管家機器人,它可以執(zhí)行玩家指定的各種任務(wù),如馴服馬匹、建造村莊、與村民會面及交易等。
到了2021年,由哥本哈根信息技術(shù)大學(xué)、紐約大學(xué)和上海大學(xué)的研究者團隊,也創(chuàng)建過一個使用3D神經(jīng)元胞自動機(Neural Cellular Automata,NCA)的系統(tǒng),并將這個系統(tǒng)架設(shè)在了《我的世界》里——它可以創(chuàng)造城市公寓、中世紀(jì)城堡等一些復(fù)雜的建筑。
這樣看來,其實從AI概念被炒得火熱的這兩年開始往前看,這項技術(shù)與咱們打游戲的壓根就沒那么遠,甚至不少游戲的誕生背后都有AI的身影。
獺向來是“AI工具論”的堅定成員,越來越強大的AI會促使整個行業(yè)向前行走。尤其是對于游戲開發(fā)者來說,AI的出現(xiàn)是一個技術(shù)和藝術(shù)的融合點。
技術(shù)上AI提供了一個全新的工具箱,允許游戲開發(fā)者創(chuàng)造出更豐富、更復(fù)雜的游戲內(nèi)容,比如新的關(guān)卡設(shè)計、自動調(diào)整游戲難度,甚至模擬真實世界的物理和生態(tài)系統(tǒng)。
到時候可能就不需要打所謂的“光影包”了
在藝術(shù)上,AI則提供了一個全新的創(chuàng)作平臺。例如,AI可以模擬出富有情感的角色,提供更深入的故事情節(jié),甚至為游戲世界創(chuàng)造出獨特的文化和語言。
土屋曉創(chuàng)造,出自RPG游戲《魔塔大陸》系列的“塔語”,就是一個完全原創(chuàng)的語言
但由于人造語言的限制,在游戲中該語言主要是作為詩魔法語言使用
AI的進步也能給游戲設(shè)計師提供了新的設(shè)計思路,我們可能會看到更多“智能”的游戲元素,比如可以自主學(xué)習(xí)和進化的NPC,或者可以根據(jù)玩家行為自動調(diào)整難度的游戲環(huán)境——而不是那種根據(jù)子彈與血量數(shù)據(jù)的簡單調(diào)整。
生化危機7與生化危機4中都有類似的系統(tǒng),玩家卡在一個場景時游戲會降低難度
這些新元素可以提供更豐富更個性化的游戲體驗,也會讓游戲的世界變得更加生動和真實。
再大膽點,AI也可能改變玩家的游戲方式——想象一下,如果你的AI游戲隊友,它可以理解你的戰(zhàn)術(shù)指令,了解你的游戲習(xí)慣,甚至預(yù)測你的下一步動作。這會讓你感覺像在和真人隊友一起游戲,也會給你帶來更多的游戲樂趣和挑戰(zhàn)。
整個老頭環(huán)笑話,被AI氣暈的場景每個玩家都經(jīng)歷過
說是這么說,AI作為好用的工具令人期待的同時,也為游戲制作者帶來了挑戰(zhàn)。
如何避免AI的行為過于機械、如何讓AI的行為更符合游戲的主題和氛圍、如何讓AI的存在不破壞游戲的平衡性等等,都是游戲制作者需要面對的問題。尤其是如何在保護玩家隱私的同時利用AI提供個性化的游戲體驗這種比較敏感的問題,也是一個迫切需要解決的矛盾點。
關(guān)于如何限制AI的發(fā)展,為了保護用戶隱私禁止訓(xùn)練的公開信
包括馬斯克在內(nèi)的2300名業(yè)內(nèi)人士簽了字,并表示擔(dān)憂——雖然獺覺得是老馬急了
但咱們依舊有理由相信,盡管面臨諸多挑戰(zhàn),AI的發(fā)展將推動游戲行業(yè)向更好的方向前進。
——盡管獺被劣質(zhì)AI繪圖搭配三流制作四流劇本的流水線AI游戲傷了一遍又一遍,獺依然這么相信著。