【游戲泛論3】博弈的本質(zhì)
????在上一期中,我一直在強(qiáng)調(diào),那種表格法將現(xiàn)實過度簡化了,那么本文中我們就回到最初,去考察一下這個簡化的過程,更細(xì)化地去反思一下,在將問題轉(zhuǎn)化為表格的這個過程中,我們究竟是怎么想的?

博弈的拓展
????我們在數(shù)學(xué)上都做過雞兔同籠問題,比如8條腿,3個頭,那么我們會假設(shè)雞x只,兔子y只,x+y=3;兔子有4條腿,雞有兩只腳,那么2x+4y=8;最終得到x=2,y=1,那么雞就有2只,兔子有1只。
????這種思維就叫作數(shù)學(xué)建模,或者說建立模型。
????也就是說,你把雞兔同籠這個偏現(xiàn)實的應(yīng)用問題,簡化成了x+y=3,2x+4y=8這兩個方程再去解決,這個簡化的過程就叫建模,通過這類解方程的思路,我們很方便地去解決很多各式各樣的現(xiàn)實問題。
????不難理解,這種我們建立的模型也就是一種理論,那么,這種數(shù)學(xué)建模的方法則代表了一種建立理論的方法,或者說關(guān)于從特殊到一般,關(guān)于如何建立理論的一種理論,正如你可以把雞兔同籠中的雞和兔換成其他動物,同樣也可以通過解二元一次方程組解決。
????或者說,這種解二元一次方程組的思想就代表了所有能用它解決的實際問題共有的一種特征,它們都可以被我們用這種方法解決。
????當(dāng)然,你也可以認(rèn)為我們一切從實踐到理論的過程,就等同于數(shù)學(xué)建模的過程,因為數(shù)學(xué)這個詞我認(rèn)為本來就代表了一種普遍意義上的抽象。
????回過頭來看,就雞兔同籠而言,你有沒有考慮過如果有的兔子因為殘疾只有3條腿呢?
????我們說,雞兔同籠這個問題是顯得很蠢的,它可能主要是被出題人設(shè)想出來用來出這種解方程的題目,但即便它幾乎在現(xiàn)實中不存在,它作為一種對現(xiàn)實的模擬,依然是足夠復(fù)雜的;也就是說,對于這個現(xiàn)實問題,二元一次方程組將現(xiàn)實過度簡化了。
????同樣的,之前的表格法,作為將現(xiàn)實中二人之間的選擇轉(zhuǎn)換為一張表格的這樣一種建模,一種理論,它也存在著這個問題,因此接下來,這次我們嘗試從復(fù)雜的現(xiàn)實出發(fā)去考慮。
????首先,我們主要會運用以下兩種思想,當(dāng)然你也可以說是兩種理論。第一,對于這類表格,我們在思考別人的可能的選擇時需要換位思考;第二,進(jìn)而,我們在考慮雙方收益時需要分類討論,當(dāng)然換位思考同樣也需要。
????我在這里之所以要強(qiáng)調(diào)這兩種思想,是因為它們在我看來也的確是很重要的,無論是在游戲中還是現(xiàn)實中,我希望各位讀者也能夠意識到它們的重要性。
????當(dāng)然,我們還可以更細(xì)地去想,比如那些選擇是如何被我想到的?事實上,在現(xiàn)實世界中,我們在任何情況下都存在無窮個選擇,因此這幾個被我們最終寫在表格中的選擇其實已經(jīng)可以被認(rèn)為是我們挑選出來的一些最優(yōu)解了,那么其中思考的過程可能就更和潛意識中的信息處理相關(guān)了,也就是說,潛意識中也或許存在一種一般性的理論幫我們更快速地做出了這個初步的篩選。
????那么,通過之前的許多理論的疊加、或者說迭代,最終這個2*2的表格作為一種更有實用性的理論展現(xiàn)在我們面前;但在之前,我們已經(jīng)做了一些最基本的假設(shè)和簡化,即同一時間,2個人,各自都有2個選擇,2*2的表格,總共4種情況,而現(xiàn)實中顯然不止2個人的合作,每個人遠(yuǎn)不止2個選擇。
????如果2個人,各自3個選擇,那就是3*3的表格,總共9種情況:

????如果3個人,各自2個選擇,那就是2*2*2,總共8種情況,那么其對應(yīng)的表格其實就是一個立方體了,每種情況各自的收益就可以用(a,b,c)來表示了:

????那么對于這類更多人的情形,比如3個人,我們可以依次固定住其中一個人的各個選擇,再去用2個人的思維去考慮,依此類推,并且我們在實際情況中其實往往也的確是這么去考慮的。
????那么x個人,各自y個選擇,每個人各自的選擇數(shù)相乘,就是總情況數(shù),總共y^x種情況,同樣的,每種情況各自的收益就都可以用(a,b,c,d……)來表示。
????我們可以先在腦海中把握一下以上這些概念。

博弈的變換
????接下來,我們進(jìn)一步思考,通常情況下,我們認(rèn)為人與人之間的不同選擇才會構(gòu)成博弈,但如果沿用這種表格的思想,我們嘗試考慮,一個人的博弈會是怎么樣的?
????換句話說,也就是我只需要列出我自己的選擇,比如之前我一直提到的,關(guān)于我對我寫不寫下這些想法的考慮。

????通過這個表格,我們發(fā)現(xiàn)這種思路也是一定程度上符合實際的,就拿電子游戲來舉例,我們在玩單機(jī)游戲的時候,其實不能說我們不是這么去考慮的。
????但隨之,也引入了一個問題,對于一些有pvp要素的單機(jī)游戲,其中的具有一定程度模擬人類智能的電腦方,我們究竟應(yīng)該將它看作一個人類對手,還是看作一個用于評判收益的要素?
????你可能會說,根據(jù)實用性去判斷,哪種思路的結(jié)果好就用哪種,這當(dāng)然是一個正確的思考方式,但更重要的是,我們要知道這兩種對同一個問題的不同思維方式之間是如何轉(zhuǎn)換的,這同時也是一個非常普遍的問題。
????我在前面提到過,對于英雄聯(lián)盟,有時候需要根據(jù)隊友的水平來改變打法。具體來說,有時候隊友水平不夠,你就不能夠把隊友看作另幾個自己去考慮問題,因為某些情況下,你小虧,隊友大賺,總體上是賺的,但他們不一定能夠像你一樣將這些優(yōu)勢擴(kuò)大,同時你也因此基本上只能圍繞隊友去作戰(zhàn)了,很難掌握自身的命運;也就是說,隊友并不值得被信任和被托付的時候,我的打法可能更傾向于自己的利益,甚至有些時候,不把他們當(dāng)人看,當(dāng)單機(jī)玩,反而能有更好的結(jié)果。
????因此,我借此想說明的是,有些情況下,其實有時候真正的人類玩家的確也不是不可以只被看作一個用于評判收益的要素。
????回到這個表格,既然我們說,收益是通過權(quán)衡各個因素得來的,那么我們把收益寫作一個函數(shù)f(a,b,c,……),括號中的a,b,c代表了一個個我們可以具體寫出來的不同的因素,而f則代表了我們綜合考慮這些因素得出收益的一個復(fù)雜的過程。

????接著,對于這張表,如果我們把B這個人也看作是計算收益時的因素,那么就是這樣:

????反之,將他看作是我們的對手,就是這樣:

????我們對比一下這兩張表,不難看出這是一種什么樣的變換,也就是,我將第一張表的收益中共有的一個因素提取到了括號外面去,而讓這個表格增加了一個維度。
????好了,根據(jù)這個說法,我們現(xiàn)在就掌握了一種理論上可以將任何博弈展開或者收縮到任意維度的方法,只要括號中的這些因素足夠多。
????那么,我們首先考慮,如果將一個非人因素從括號中提取出來會怎么樣?
????同樣拿我“寫不寫下這些想法”這件事來說:

????在這個表中,出不出意外顯然很難說是我的選擇,比如夸張一點,地震了,你很難說我可以預(yù)測到這一點;同時,這當(dāng)然也不可能是別人的選擇,但我們未必不會去考慮類似這些意外。
????那么,我們發(fā)現(xiàn)由上面那個我們總結(jié)出來的方法,所得到的這個表格,其實也是很符合現(xiàn)實的,我們評判收益時其實未必也不是這么想的。
????當(dāng)然,兩個也可以都是我,只要那個被提取出來的因素也可以被看作是我的選擇,比如:

? ? (當(dāng)然,現(xiàn)實中我不喝酒也不開車,我只是舉個例子。)
????進(jìn)而,我們也可以在兩個人的博弈中加上一個非人因素,也就是一個三維的表格,不難理解,比如地震和不地震的兩種情況分別對應(yīng)一個人與人之間的二維的表格。

剝離了主觀性的博弈/自然博弈
????那么,反過來,如果我們把A和B這些代表人的因素全都塞到括號里,再把一個非人因素拉出來會怎么樣?

????問題在于,前面也說過,f代表著A對收益的評判,但是A現(xiàn)在已經(jīng)被塞入了括號,那么“收益”自然無從談起,這里的f似乎失去了意義。
????如果你說,照這張表格來思考也沒問題,的確如此,我們一般來說都會認(rèn)為沒地震會比地震對我們來說要好,但這么去想,其實就不是這個表格想要表達(dá)的,你在本質(zhì)上其實想的還是類似上面那個關(guān)于我寫不寫文章的例子,只是沒把自己的選擇詳細(xì)列出來罷了。
????換句話說,我們前面所謂的“收益”還是太過狹隘了,它只能夠基于一種主觀性去描述表格中的內(nèi)容,而對上面這個表格就不適用了。
????那么,我們反思一下,所謂“收益”,到底是什么?
????在前面,我們說,f代表了我們綜合考慮這些因素得出收益的過程,或者說一種用于判斷的邏輯,但它又是基于何物呢?很簡單,基于我們的目標(biāo)。
????換句話說,回想我之前舉過的一個個例子,寫下的一個個表格,但無論當(dāng)時我們認(rèn)為的影響收益的因素有多多,對收益的判斷有多復(fù)雜,在最終,在最后的最后,我們總存在一個相對清晰明了的目標(biāo),比如英雄聯(lián)盟最終無非是為了贏,為了看到對面基地爆炸,比如對于合作與背叛,可能你最終是為了賺更多的錢,乃至于,長遠(yuǎn)一點來說,為了追求一個幸福的人生。
????而這里就涉及到一種時間上的先后了。我們在追求某個目標(biāo)的途中,為了它作出了很多的博弈和選擇,那么這些選擇在時間上,一定是在這個我們所想的目標(biāo)之前的。
????換句話說,我們想要達(dá)到那樣一個未來,也因此,我們才會建立起這樣一種博弈的理論,去更好地認(rèn)識到我們要做出哪些選擇,才更可能達(dá)到那樣的未來;換個角度來看,它作為一種理論,本就是用于預(yù)測未來的,這和我之前所講的關(guān)于理論和實踐的內(nèi)容也是一致的。
????回過頭來,既然收益本質(zhì)上其實就代表了一種對未來的判斷,那么對于這張圖,在剝離了主觀性后,很簡單,它其實就代表了某個未來,比如一個地震后的未來,以及一個沒有發(fā)生地震的未來。
????換句話說,我們可以嘗試從一種所謂的上帝視角去看待。上帝是全知全能的,而我們相比之下是愚笨的,因此我們的許多對收益的評判,其實是遠(yuǎn)遠(yuǎn)做不到完全準(zhǔn)確的;
????或者說,雖然我不能夠完完全全地考慮到,但很多事物也的的確確在影響著我所作出選擇的收益,我考慮不到只是因為我的能力有限罷了。
????我無法判斷我現(xiàn)在熬一天夜最終減少了我多少壽命,或許事實上熬的這一夜為我?guī)淼暮锰幱珠g接讓我最終多活了幾年,誰也不知道,但上帝可以推算到這一步;
????或者說,我這里說的上帝實際上就代表了一種絕對的客觀性,并且我假設(shè)這種客觀性是存在的,也就是說,這里的“收益”是客觀的,它其實就是這個現(xiàn)實世界本身。
????由此,我們可以索性把一切都放入括號中,那么博弈就變成了:

????那么,如果說這個括號中的事物代表了世間的一切事物當(dāng)前的狀態(tài),比如可以是每個原子和分子的狀態(tài),那么F就代表了這個世界運行的基本規(guī)律,它可以計算出這個世界絕對準(zhǔn)確的未來,而這個F(……)整體就代表了我們此時此刻所處于的現(xiàn)實世界。
????進(jìn)一步,我們可以嘗試將兩個非人因素提出來,這實際上就是博弈在進(jìn)化論上的一種運用,我們可以稱之為一種自然博弈。
????我記得初中還是高中的時候,生物課上有這樣一個例子:有一個地區(qū)都是黃綠色翅膀的蝴蝶,不過某些基因會導(dǎo)致存在少數(shù)的黑色翅膀的蝴蝶,工業(yè)革命期間,由于黑煙排放,許多樹叢都被染成了黑色,從而黑色翅膀的蝴蝶具有生存上的優(yōu)勢,因為能夠在這種環(huán)境下更隱蔽,那么自然而然,優(yōu)勝劣汰,黑色翅膀的蝴蝶逐漸占據(jù)了多數(shù)。
? ? 關(guān)于這個博弈我們可以這么描述:

????它向我們清晰地揭示了對于這些蝴蝶,它們所處環(huán)境與翅膀顏色的某些關(guān)系。
????蝴蝶沒有我們那么聰明,無法認(rèn)識到這一點,也無法通過主動偽裝自己的翅膀顏色來更好地生存,因此,我們可以認(rèn)為,它們對于這個博弈來說并沒有主觀能動性。
????同樣的,對我們?nèi)藖碚f,比如有一種親屬選擇的說法,意思是,我們之所以會對親人或者朋友會比較好,是因為親人和我們的基因類似,而朋友之所以是朋友,也是因為他們的某些表現(xiàn)和我相似才會成為朋友,而這些相似的表現(xiàn)也代表著一些基因上的相似,因此,我們會對他們好,在基因?qū)用嫔系慕忉尵褪沁@些基因在做出能夠讓它們能夠更好的延續(xù)和存活下去的選擇罷了。
????但如果一般情況下,我問你,為什么你會對親人和朋友會更好?不管怎么說,至少你不太可能用上面這個說法去解釋,而會更偏向于一種基于人的、主觀的解釋方式,因為這種解釋跳過了我們這個“對親人和朋友會更好”的這個行為所體現(xiàn)的主觀能動性,直接來到了基因?qū)用?,?dāng)然,在這個層面,我們本來就還沒出生,也本來就沒有所謂的主觀能動性。
????從中我們也可以初步意識到,一個現(xiàn)象,它可以有相對主觀的解釋方式,也可以有相對客觀的解釋,并且它們之間的界限是很模糊的,正如前文中所說,既然我們也都可以被放入f或者F的括號中,那么我們和那些所謂客觀的因素又有什么太大的差別呢?關(guān)于這一點,以后有機(jī)會再詳細(xì)說說。

“簡單”博弈
????接下來,再回到這個F:

????對于這個1*1的表格,我們反過來,再把其中的A提出來,嘗試和原先的表格比較一下有何區(qū)別。

????不難發(fā)現(xiàn),這張表體現(xiàn)的其實就是我之前所說的那些“不同的未來”。在生活中,我也會常常聽到過這樣的言語,比如“人生就是一個個選擇的疊加”,比如“我們的每個不同的選擇后面都分叉出了一個新的平行世界”等等,而這些話語,無非就在說明著,代表f的愚蠢的我們不能夠像F一樣徹底地描述這個時間點后的那個世界。
????畫個圖來表示就是這樣:

????而這個思路和象棋、圍棋等棋類就非常貼合了。
????在這些棋類游戲中,時間的最小刻度就是一方的一次落子,并且它們明確地規(guī)定只存在雙方,而且雙方每一步可能的選擇都是公開的,能走的步再多也只有那些;
????同時,我們借此也可以很容易理解上面那個平行世界的思想,比如開局,A在所有可能的選擇中下了一步棋,從而整個世界的狀態(tài),也就是整個棋盤的狀態(tài),清晰地變成了A下了這一步后的樣子,并且輪到對方落子;換句話說,你前面下了什么已經(jīng)過去了,現(xiàn)在的棋盤世界已經(jīng)變?yōu)榱爽F(xiàn)在的狀態(tài),這就是一盤從現(xiàn)在開始的由對方先動的擁有一個新的開始狀態(tài)的棋局了。
????那么,既然這些棋類已經(jīng)簡化到了如此程度,那么它們是完全信息博弈嗎?
????根據(jù)前面對完全信息博弈的定義,我們現(xiàn)在只需要考慮兩人心中各自對任何一步棋的收益是否是一致的。
????這顯然是不一致的,因為正是雙方對有些落子心中的判斷不同,才會有輸有贏;不然,因為雙方對任何一個局面的最優(yōu)落子都是同一個,那么這兩個人無論下多少盤,結(jié)局都是一樣的,不是嗎?因此它們并不是完全信息博弈。
????那為什么也有人會認(rèn)為它們是完全信息博弈呢?
????因為這些人把f和F混淆了,至少在我對完全信息博弈的定義下,收益指的是雙方各自對各個選擇作出的收益判斷,即便知道了棋盤上的一切信息,我們作為f也幾乎不可能像F一樣看到所有可能的未來,這也是我前面一直在說的。
????說句題外話,如果我們能夠計算出棋盤上所有可能的情況呢?
????那就更沒意思了,因為對于象棋、圍棋這些棋類,它們在理論上先手或后手中必有一方存在必勝/必不敗的策略,這是已經(jīng)被證明的,感興趣的可以自己上網(wǎng)搜一下;但是,人類目前計算能力最強(qiáng)的計算機(jī)都無法找到這些策略,更不用說我們靠自己的大腦了,況且棋類比賽也不可能沒有時間限制。
????更具體一點來說,一張19*19的圍棋棋盤,簡單來考慮,第一個落子有361種可能性,第二個有360種,依此類推,所有的可能就有361*360*……*2*1約等于10^768,這個數(shù)量是什么概念呢,人類已知宇宙中的原子數(shù)量也只有10^80個左右。
????那么,棋手要怎么思考每一步的收益呢?我們對此其實都有一個比較普遍的認(rèn)知,也就是棋手會去算很多步;當(dāng)然,我知道對下棋來說,單純的計算能力肯定不是全部,畢竟開局都是相同的,但它絕對是棋類所考察的最重要的能力之一。
????我們說算5步,通常會指棋手能夠思考到,從當(dāng)前這一步,當(dāng)前局面開始,往后5步時的一些局面;換句話說,這就是我們常說的一種思維的深度,在前面也提到過,這在現(xiàn)實中其實就代表了一個人他考慮問題是否長遠(yuǎn)。
????舉個最簡單的例子,天氣預(yù)報說明天要下雨,那我們會提前在包里準(zhǔn)備一把傘,其中我們用到的思維方式其實和上面在本質(zhì)上是一樣的;之前的文章中,我也舉過一些有關(guān)英雄聯(lián)盟的例子,其中有許多博弈的收益的確也依賴于未來的其他博弈。
????同時,計算當(dāng)然不僅僅指深度這種在時間上的跨越,還有你是否能夠?qū)Ξ?dāng)前你所有可能的選擇都作出一定的考慮,那么在現(xiàn)實中,就代表一個人他考慮問題是否周到。
????但正如前文中我也一直在表達(dá)著這樣一個意思,也就是我們?nèi)耸遣豢赡茉?strong>深度和廣度上做到完美的。
????棋類,最終也無非贏和輸?shù)鹊葞追N情況,對于我們?nèi)?,除非是已?jīng)能夠算到最后勝負(fù)的殘局,絕大多數(shù)情況下,我們的思維深度都是遠(yuǎn)遠(yuǎn)達(dá)不到盡頭的;我們只能盡可能地模擬這種F所代表的思維,最終在我們能力的盡頭,依舊只能對之后的未來作出相對模糊的評估。
????而在下棋中,這一點就體現(xiàn)在,棋手會排除一些明顯會讓自己處于劣勢的選項。

????正如圖中所示,我們有可能在第一次思考時就排除了,也就是圖中0到1的過程,當(dāng)然,也可能在思考到不同的深度時才進(jìn)行排除;也由于這張圖形似一棵樹,我們也可以稱這種排除的行為叫做剪枝。
????那么,何時需要剪枝呢?這個思路就更像我們上一章中去評估收益的方法了。
????比如一個棋手對于某條他正在思考的路線,他想到第5步的時候,認(rèn)為如果下到這個局面,他會占有一些優(yōu)勢,那么他可能會轉(zhuǎn)而去思考其他路線,從而通過比較它們,作出當(dāng)前的自己認(rèn)為是最優(yōu)的選擇;當(dāng)然,如果仍有余力,時間也充裕,那么自然可以在深度和廣度上更進(jìn)一步。
????關(guān)鍵在于,為什么對于某些局面,他可以快速地判斷自身是否優(yōu)勢,而不需要像之前一樣進(jìn)行無微不至的思考呢?
????我曾經(jīng)看過象棋的一些最基本的教程,雖然自己完全沒去下過,但我在這里還是拿象棋舉個例子。
????在象棋中,有著許多可以用于大致判斷自身優(yōu)劣的概念,當(dāng)然,別的棋類中肯定也有類似的,比如最基本的,在一方少子的情況下棋子價值的對比,還有,比如得到或者失去了先手,某一側(cè)子力對于進(jìn)攻或者防守相對空虛,乃至子和勢的關(guān)系,有些時候可能通過棄子來發(fā)動攻勢是更好的選擇,等等。
????因此,我們在明白了這種可以說是相對宏觀的一些概念,再加上豐富的經(jīng)驗后,有時候就可以憑借它們?nèi)謩葸M(jìn)行判斷,當(dāng)然,這同樣也需要思考,只是相比一步一個腳印的計算,我們不需要花費大量的時間和精力。
????不過,弊端也在于,它不是完全和徹底的思考,因此在某些情況下,我們也許會因此疏忽了某些可以制勝的選項,相比之前那種最小時間刻度下的思考,至少在思考的范圍內(nèi),那些局面都是絕對的。
????總結(jié)一下就是,先基于深度和廣度的盡可能精細(xì)地思考,進(jìn)而在各個分支的盡頭進(jìn)行相對不嚴(yán)謹(jǐn)?shù)脑u估和比較后再進(jìn)行剪枝,從而比較得出當(dāng)前的最優(yōu)解,這就是我們作出選擇前的一系列思維過程。
????那么對這張圖來說,那些盡頭就代表了圖中的那個“目標(biāo)時間點”,對應(yīng)了我們想得最遠(yuǎn)的那個時間點,我們可以把這段時間稱為“一個時間階段”,比如,算5步就是指5個最小時間刻度組成了一個時間階段。


“復(fù)雜”博弈
????那么,我們再來談?wù)?strong>英雄聯(lián)盟,它無非也是敵方基地爆炸和我方基地爆炸兩個最終結(jié)果,為何玩家們不會像棋類一樣在深度和廣度上思考那么多?
????因為英雄聯(lián)盟比棋類復(fù)雜得多。
????英雄聯(lián)盟服務(wù)器的tick數(shù)為30,可以理解為,玩家的輸入每1/30秒也就是每0.0333s被服務(wù)器處理一次;也就是說,我們可以簡單理解成,英雄聯(lián)盟這個游戲中時間的最小刻度是33ms。
????那么這里就要涉及到一個新東西了,叫做人的思維刻度(時間)。
????我們之前提到的最小時間刻度,是棋盤所代表的,是下棋的規(guī)則所規(guī)定的,換句話說,就是“那個世界”定下的,而人的思維不一定能達(dá)到這個刻度,就比如英雄聯(lián)盟,玩家的思維再細(xì)也達(dá)不到33ms這種程度,而棋類作為一種現(xiàn)實世界很大的簡化,棋手的思維刻度是可以達(dá)到那個世界的上限的。
????同樣的,選擇的多少也是如此,棋類中每一步的可能選擇是可以被窮舉的,但英雄聯(lián)盟不可以,一個玩家在任何一個tick中可能的輸入序列幾乎也是無窮無盡的。
????因此,對于英雄聯(lián)盟,由于我們大腦的處理能力有限,人的思維刻度遠(yuǎn)遠(yuǎn)達(dá)不到世界的刻度,我們不可能每33ms作出一個判斷,不可能全部考慮到自己當(dāng)前所有可能的行動,因此其中總會存在一些玩家?guī)в?strong>隨機(jī)性的操作,比如甚至說在某處多點了一下地板,但不可否認(rèn),它也會對后續(xù)的游戲發(fā)展起到影響,但這種影響對我們而言是不可預(yù)測的,我們很難意識到,并且就算意識到了也幾乎不可能去知道;更何況,假設(shè)一把游戲25分鐘,那么換算到棋類中就有45000步,這種深度更加擴(kuò)大了這種隨機(jī)性和復(fù)雜性。
????如果從信息的角度去考慮,棋類的不完全信息可以說僅僅體現(xiàn)在雙方的計算能力,而對于英雄聯(lián)盟,由于思維刻度的原因,其中許多博弈所對應(yīng)的表格都是千瘡百孔的;何況除此之外,還有戰(zhàn)爭迷霧等等的存在,對局中的信息,相比象棋而言,對每個玩家都太不完全了。
????綜上,英雄聯(lián)盟局面的復(fù)雜度是棋類游戲無論如何都遠(yuǎn)遠(yuǎn)不可能觸及的,那么玩家是如何去思考這個游戲的呢?
????實際上,在英雄聯(lián)盟中,玩家們更多的會去想,這一波團(tuán)打完了賺不賺,經(jīng)濟(jì)差和等級差怎么樣等等,依此來判斷局勢。
????這其實和棋類是一致的,玩家們會思考下波團(tuán)怎么打好,而不是直接想到勝負(fù)那么遠(yuǎn),也就是和之前說的一樣,玩家們將一個或許多自己思維的時間刻度合在一起,成為了一個時間階段,并且每個時間階段都有著對應(yīng)的一個短期的目標(biāo)。
????比如下波要打小龍團(tuán),那我會思考我要為這個團(tuán)戰(zhàn)做哪些準(zhǔn)備,但我們往往就不會往下思考了,因為對于這個復(fù)雜的游戲,團(tuán)戰(zhàn)的可能性太多了,突發(fā)情況也可能非常多,因此這種過于提前的思考就沒那么有價值,從而沒那么必要。
????并且,由于這種分段的思維,我們還需要注意這些時間段之間的聯(lián)系,也的確如此,英雄聯(lián)盟中也會有滾雪球這類概念的提出。
????再往回看,這些和前面我提到的象棋中的那些概念其實也是一個道理,包括所謂一些開局、中局以及布局的思路,它們其實也就是對其中幾個回合整體,作出的對勝負(fù)的一種評估。
? ? 并且,從這個例子中,可以更容易地意識到,我們在對某些整體作出評估時,首先會整理出對其對應(yīng)短期目標(biāo)的各種影響因素,其次我們還會對其進(jìn)行一定“降維”,從而篩選出最適合我們基于去評判的特征,比如團(tuán)戰(zhàn)勝負(fù)乃至游戲勝負(fù)對應(yīng)的可能就是“經(jīng)濟(jì)差”這個指標(biāo),甚至也可以歸納和抽象出一些新的指標(biāo)和特征,比如前面提到的象棋中的子和勢,或是可以對博弈表格中的選項進(jìn)行分類;以及,前文中所說的時間階段和短期目標(biāo),本質(zhì)上也可以被認(rèn)為是一種降維,從而能夠簡化問題。
????當(dāng)然,由此而來的弊端,在英雄聯(lián)盟中也是有所體現(xiàn)的。比如,最普遍的,當(dāng)經(jīng)濟(jì)差很大的時候,其實拖到大后期,可能打好一波團(tuán),說不定就逆經(jīng)濟(jì)翻盤了;再比如,我們看到門牙塔掉了,常常會說游戲性質(zhì)發(fā)生了變化,完全沒錯,這說明我們知道在這個情況下,對面偷塔來取得勝利會突變一個非常不錯的選擇;還有,我還記得之前克隆大作戰(zhàn)中也有5個大頭中路平推的套路,對于這種直指最終勝負(fù)的思路,我們就無法用經(jīng)濟(jì)差去評判了。
????這些也就對應(yīng)了我之前提到的剪枝思維的局限性,它的確會存在一些漏洞。

現(xiàn)實世界所對應(yīng)的博弈模型
????那么,再來看現(xiàn)實世界,我們在很多時候也的確是通過制定一些短期的目標(biāo)來讓我們更好地、更明確地行動起來,比如下周要做幾個視頻,下個月要減肥多少斤、賺多少錢等等。
????當(dāng)然,我們之前也說過,現(xiàn)實世界無非是就是F(),但接下來,我們嘗試保留人的概念來思考。
????那么,對于棋類中的2人,在現(xiàn)實中就是人口數(shù),比如80億;棋類中的最小時間刻度,在現(xiàn)實中不妨認(rèn)為是一段無限短的時間;棋類中的每個時間點的可能選項,在現(xiàn)實中就不妨認(rèn)為有無窮多;而棋類中當(dāng)前時間點代表的m*n的一個表格,在現(xiàn)實中當(dāng)前時間點所代表的就是∞^80億的一個表格。
????至于時間階段,就比較靈活了,更多的是看我們的需求和目標(biāo),但我們需要知道,無論這個階段有多短,由于最小時間刻度的原因,它總是可以被分得更細(xì),這也是棋類和現(xiàn)實世界的一個很大的差別。
????再回到之前這張圖,我們就能夠很好地理解左下角那句話了。

????“基于主觀性的”其實指的就是我們從F()中提出了人,我們在用人腦去思考;
????“相對片面的”指的就是我們思考的能力在思維刻度上是有限的;
????而“對某個相對短期目標(biāo)的” 指的就是我們思考的能力在深度和廣度上是有限的;
????當(dāng)然,不難理解,實際上后兩者已經(jīng)包含在“基于主觀性的”這個修飾的語句中了,我只是加以解釋了一下。
????進(jìn)而,基于這個現(xiàn)實世界對應(yīng)的博弈模型,我們可以回過頭去想想,最開始的那個關(guān)于合作和背叛的2*2的表格根本上是由此如何一步步簡化而來的,是不是就更加容易理解了,并且這種理解也更加深刻和本質(zhì)了。

附:兩個問題,以及一些展開
????那么接下來,談?wù)剮讉€我之前沒機(jī)會提的問題。
????第一個問題,當(dāng)我們是博弈的一方時,為什么我們傾向于把他人從因素中提取出來?
????首先,我們要知道,無論我們自己在不在這個表格中,這個表格都是我們畫出來的,也就是說,這種表格的方式本身代表了我們作為人的,一種自然而然的思維。
????比如,我問你,你能不能不像我前面說的那樣去思考?能不能換一種思考方式?
????這一定是不可能的,因為我們本來就是在這么思考,上面那些理論也正是從我們的這種自然的思考方式中分析和提取出來的。
????因此,唯有當(dāng)對方也是人的時候,這個博弈才會更可能滿足完全信息博弈中的這一點:“對方也在這么思考?!睆亩@種博弈的思維才更可能具有實用性。
????說白了,很簡單,因為人與人是更加對等的;當(dāng)然,也只是更傾向于,比如我之前也舉過英雄聯(lián)盟中的例子,有些時候把人放到括號中去考慮的確會是更好的選擇。
????第二個問題,我們可以發(fā)現(xiàn),在那些棋類中,對收益的評判是不需要分析過去的,只需要分析未來,但為什么在現(xiàn)實中,或者復(fù)雜一點的游戲中,我們考慮f時不僅要像棋類中那樣考慮未來,過去的信息實際上可能會更重要?
????第一,之前也說過,對于越復(fù)雜的問題,就越難往后想,并且越往后,價值也往往越小,因此考慮未來的思考可能就會顯得相對不重要;
????第二,我們可以想一想,“尋找規(guī)律”作為現(xiàn)實中的一類行為,它們在我的這個現(xiàn)實世界所代表的博弈模型中 ,該如何體現(xiàn)?
????不難理解,尋找規(guī)律并且進(jìn)行運用,也就是通過過去的已知的信息,從而對未來的博弈中未知的信息進(jìn)行預(yù)測。
????在象棋中,因為我們知道這個世界的一切運行規(guī)則,比如馬走日、象走田,所以不需要過去的信息;反過來看,如果棋手都不知道這些子是怎么動的,又怎么可能能夠像之前那么去思考呢?
????同樣的,我們?yōu)槭裁匆獙F(xiàn)實世界分為一個個時間點,每個時間點對應(yīng)著一個當(dāng)前的世界狀態(tài),用這種方式去看待?
????正是由于我們一開始完全不知道它的規(guī)則,無法很好地認(rèn)識到現(xiàn)實世界的規(guī)律,它所對應(yīng)博弈模型中的信息太過不完全,因此,我們才會基于這種方式,嘗試去總結(jié)規(guī)律,想要通過歸納得到理論,從而去更高效地去獲取信息,填補(bǔ)我們對現(xiàn)實世界的認(rèn)知缺失,進(jìn)而更好地去預(yù)測未來。
????英雄聯(lián)盟中也是如此,如果我通過過去的一些現(xiàn)象,發(fā)現(xiàn)對面習(xí)慣性向下走位,如果他沒有意識到他的這種習(xí)慣,那么根據(jù)他的這種行為規(guī)律,我就可以預(yù)判向下鉤,從而獲取優(yōu)勢;以及一直說的,我們可以通過隊友的一些行為,初步判斷出他們的水平,從而可以更好地去規(guī)劃如何贏下游戲,這也是一個道理。
????更不用說,對于這些“可重復(fù)”的游戲,實際上過往的那些重復(fù)同樣也能夠被理解為是一種過去,我們由此獲取信息同樣也是這樣一個由過去預(yù)測未來的過程。
????或者說,我建立起的這種模型代表的也許是一種更原初的思維。
????不難理解,我們作為人,也無非就是在一個個相對離散的時間點上通過感官等等收集著周圍事物當(dāng)時的狀態(tài),從而,我們將這些離散歸納為連續(xù),由特殊到達(dá)一般,才有了所謂“規(guī)律”的概念;
????我之前也說過,某些所謂科學(xué)思想、數(shù)學(xué)思維,在不適當(dāng)?shù)膫鞑シ绞较?,反而會禁錮人的思維,但如果按照這種方式來看待世界,其實就能夠很好地避免這個問題,也能夠更本質(zhì)地認(rèn)知這個世界。
????總結(jié)一下,也就是,在我們分析收益做出決策的時候,分析過去和分析未來這兩種思維是需要融匯貫通的,這樣才能夠帶來更準(zhǔn)確的預(yù)測和更好的結(jié)果。
????另外,我們可以想一想,在前文中,我基于“理論”得到了有關(guān)博弈的理論,從而又用這個理論解釋了“理論”,這是否又一種“自指”呢?
????的確如此,但在這個例子中,我們能夠相對明確地感受到,我所基于的“理論”和我后面所解釋的“理論”實際上是有所差別的,它們不完全是同一個事物。
????與其說是“自指”,不如說是一種“交織”,很多事物和概念之間,正如理論和實踐一樣,本就是互相依存、互相促進(jìn)的;基于博弈去解釋世界,還是基于理論和實踐去解釋世界,它們之所以能夠在對方身上互相體現(xiàn),正是因為它們本身就是不完全的、也是不同角度的對世界的一種“側(cè)寫”;然而我們向前追尋和還原,又會觸碰到潛意識的壁障,或者說,它們一定是首先經(jīng)歷了潛意識中的某些過程,之后在某個階段中同時涌現(xiàn)在我們的意識層面,因此對我們的意識來說,前面的過程才會顯得是一個“黑箱”,模糊而令人困惑。
????綜上,這些就是我想說的我認(rèn)為的關(guān)于博弈的本質(zhì)。
????在前文中,我為了便于各位理解,模擬了一種自然的、由淺入深的思維過程來講述,這種方式的確會讓整體看上去有些亂,希望讀者可以仔細(xì)閱讀和思考,從而能夠很好地吸收其中對你有用的一些觀點,那么本文就講到這里。