GAEA,讓“活”的虛擬場景(如:長安城)成為現(xiàn)實(shí)
近日,我們發(fā)布了“活的長安城”,它是一個(gè)永續(xù)運(yùn)轉(zhuǎn)的“AI社會”雛形,性格各異的AI NPC們生活其中,它們在比人際互動更豐富的社會生活層面相互連結(jié),彼此影響,進(jìn)而讓長安城里源源不斷地涌現(xiàn)新鮮事,使之漸漸演化出如《西部世界》般的廣闊藍(lán)圖。

令“活的長安城”成為現(xiàn)實(shí)的是GAEA——一項(xiàng)擁有構(gòu)建AI NPC生態(tài)能力的技術(shù)系統(tǒng)。GAEA是超參數(shù)探索“AI社會”的階段性成果,它能讓無數(shù)個(gè)長安城(虛擬場景)涌動起來。
那么,在技術(shù)層面,GAEA是如何實(shí)現(xiàn)這一切的?

先回到GAEA的本質(zhì),它是一個(gè)復(fù)雜系統(tǒng),具備以下特征:
包含一群相互作用的對象(決策主體),同時(shí)這些對象是多樣性的。
這些對象的行為受反饋(社會常識)的影響,可以根據(jù)過去的情況調(diào)整策略。
系統(tǒng)通常是“活的”、“開放的”,它的涌現(xiàn)現(xiàn)象常常出人意料。
由此可見,構(gòu)建GAEA的要點(diǎn)在于打造有“生命”的AI NPC,以及建立反饋機(jī)制。所謂“反饋機(jī)制”,指的是:GAEA讓AI NPC個(gè)體之間、子系統(tǒng)之間可以相互作用的系統(tǒng)能力。
為此,我們給GAEA搭建了兩個(gè)子系統(tǒng),其中,環(huán)境系統(tǒng)(Environment)負(fù)責(zé)與海量AI NPC產(chǎn)生交互、反饋,并驅(qū)動整個(gè)AI NPC生態(tài)的自運(yùn)轉(zhuǎn);靈魂系統(tǒng)(Soul Module)則打造有“生命”的AI NPC。與此同時(shí),二者在GAEA的反饋機(jī)制下相互作用,彼此施加影響,使“AI社會”得以永續(xù)運(yùn)轉(zhuǎn)。

先從“環(huán)境系統(tǒng)”說起,它由物理環(huán)境和社會環(huán)境組成。其中,社會環(huán)境能讓AI NPC們無時(shí)無刻不在交互、反饋,并記錄因交互、反饋生成的語言、行為、關(guān)系等信息,形成虛擬場景的文明記憶庫,這個(gè)文明記憶庫將持續(xù)影響如舞女、書生、巡捕等AI NPC的后續(xù)行為決策,從而使實(shí)現(xiàn)AI NPC生態(tài)自運(yùn)轉(zhuǎn)。
可以說,社會環(huán)境是GAEA反饋機(jī)制得以建立的關(guān)鍵,它具備“人類社會常識”,包含一切帶有人類社會含義的狀態(tài)標(biāo)簽,比如非物質(zhì)的快樂、希望、口碑,以及人類社會的知識和規(guī)則等信息。至于物理環(huán)境,顧名思義,它是虛擬場景本身(如建筑)及其他AI NPC等物理存在信息。
由于GAEA中時(shí)間維度的存在,在“AI 社會”的演化過程中,環(huán)境系統(tǒng)會在AI NPC行為的影響下發(fā)生改變,反過來,環(huán)境系統(tǒng)的改變也會作用于AI NPC的靈魂系統(tǒng),進(jìn)而影響AI NPC的行為決策。類比人類社會,人與自己所身處環(huán)境的相互作用,AI NPC與環(huán)境也一樣。但AI NPC與環(huán)境“互為因果”有一個(gè)前提,即AI NPC有“生命”,它能夠做出符合自身邏輯的決策,并采取行動。

在GAEA中,打造有“生命”的AI NPC由靈魂系統(tǒng)來實(shí)現(xiàn),它能設(shè)定AI NPC角色、性格、目標(biāo),記錄AI NPC在虛擬場景中生活發(fā)生的各種事件。比如,在“活的長安城”里,靈魂系統(tǒng)賦予舞女天性浪漫的藝術(shù)家性格,記錄她在長安城生活的所有印記,比如約會。
從技術(shù)層面看,靈魂系統(tǒng)主要由上下兩層模型組成,上層是引入“Intrinsic motivation”(內(nèi)在動機(jī))的長序列策略模型,負(fù)責(zé)制定驅(qū)動下層行為決策的宏觀策略;下層則是通過符號系統(tǒng)建模的多任務(wù)模型,它依據(jù)上層的宏觀策略,在微觀層面制定具體的行為決策。而上下兩層模型的相互作用依靠AI NPC的“記憶”——“記憶”是AI NPC有“生命”的關(guān)鍵,它可以把過去和當(dāng)下整合為一體,并且每時(shí)每刻都在刻畫未來。

“記憶”中最重要的是“Internal state”(內(nèi)在狀態(tài))?和“Memorized events”(個(gè)體記憶庫)。“內(nèi)在狀態(tài)”可以理解為AI NPC在性格、長短期目標(biāo)相互作用下呈現(xiàn)出的結(jié)果,其具體體現(xiàn)為心情等數(shù)值的變化;“個(gè)體記憶庫”則可看作AI NPC個(gè)體過往經(jīng)歷的合集,由AI NPC和社會環(huán)境相互作用形成,是一個(gè)較為抽象的存在。
比如,在“活的長安城”里,舞女為什么會把跳舞的時(shí)間騰出來,翹班去和僅有一面之緣的書生約會呢?原因就在于,舞女是浪漫值很高的藝術(shù)家設(shè)定,當(dāng)她的心情需要調(diào)整恢復(fù)時(shí),來一場甜蜜約會是不錯(cuò)的選擇。但這個(gè)決策并不僅僅是天性浪漫的沖動,在決定翹班(宏觀策略)時(shí),舞女還衡量了自己的約會(短期目標(biāo))與成為首席舞蹈家(長期目標(biāo))之間的關(guān)系,并回顧了自己過往的相關(guān)經(jīng)歷(個(gè)體記憶庫),在仔細(xì)掂量之后,舞女最終決定翹班去酒樓赴約(行為決策)。

可見,擁有“靈魂系統(tǒng)”的AI NPC們不僅因角色不同而各具目標(biāo),還因個(gè)性、過往經(jīng)歷不同而生發(fā)多種行為模式。在上述例子中,如果舞女沒有很高的浪漫值,沒有為平衡數(shù)值的短期需求,抑或她因曾有過糟糕的約會體驗(yàn)而拒斥約會,舞女在長安城的這條故事線都會向別的方向發(fā)展。同時(shí),AI NPC的每一個(gè)行為決策還會受外部“環(huán)境系統(tǒng)”的影響,也就是說,舞女身處的環(huán)境也會影響她是否會為了約會而翹班,故事線的發(fā)展可能再次被影響而發(fā)生改變。
也就是說,每一個(gè)場景都是多節(jié)點(diǎn)、非線性的,每一個(gè)AI NPC在任何節(jié)點(diǎn)上都有N種選擇,都能涌現(xiàn)出無數(shù)條故事線。若將AI NPC的數(shù)量升級到海量級別,節(jié)點(diǎn)數(shù)量將隨之呈指數(shù)增長,故事線亦隨之暴增。
在GAEA創(chuàng)造的“AI社會”中,只要有AI NPC行動,整個(gè)AI NPC生態(tài)就會被激發(fā),在海量AI NPC無時(shí)無刻的交互、反饋下源源不斷地涌現(xiàn)內(nèi)容,并因?yàn)闀r(shí)間維度的存在形成巨大的文明記憶庫,這個(gè)文明記憶庫使AI NPC們過去的決策對彼此的未來產(chǎn)生影響,從而實(shí)現(xiàn)一個(gè)動態(tài)平衡的自運(yùn)轉(zhuǎn)生態(tài),最終演化出極具復(fù)雜性的“AI社會”。

當(dāng)人類用戶進(jìn)入“活的長安城”,面對身邊不計(jì)其數(shù)、富于變化的AI NPC,人類用戶不再擁有上帝視角,化身成“AI社會”里蕓蕓眾生中的一員,體會無限逼近真實(shí)的沉浸感所帶來的極致體驗(yàn):在沒有腳本的“活的長安城”,誠實(shí)友好與爾虞我詐并存,未來永遠(yuǎn)未知,而“時(shí)間永遠(yuǎn)分岔,通往不可計(jì)數(shù)的未來。”
這就是GAEA帶來的想象力:你創(chuàng)造自己的城市,書寫自己的故事,自由地體驗(yàn)每一念選擇造就的新世界?,F(xiàn)實(shí)世界已成章法,人生不可重來,但因?yàn)镚AEA的存在,在虛擬世界中,“穿越”多重宇宙過上千萬種人生將成為現(xiàn)實(shí)。