【零基礎(chǔ)學(xué)經(jīng)濟(jì)Ep146】《西方經(jīng)濟(jì)學(xué)》經(jīng)濟(jì)概念梳理P291:博弈論初步
第十章 博弈論初步
經(jīng)濟(jì)主體之間的相互關(guān)系有兩種重要的類型——
某經(jīng)濟(jì)主體的行為對其他經(jīng)濟(jì)主體不會產(chǎn)生任何影響,或者,即使有影響,其影響也微不足道,完全可以忽略不計——該經(jīng)濟(jì)主體在決定自己行動的時候,就無須考慮其他經(jīng)濟(jì)主體的反應(yīng);
某經(jīng)濟(jì)主體的行為對其他經(jīng)濟(jì)主體有重要和顯著的影響——該經(jīng)濟(jì)主體在采取行動之前,就必須考慮這一行動對其他經(jīng)濟(jì)主體的影響,以及由此而引起的其他經(jīng)濟(jì)主體的反應(yīng)。
博弈論的任務(wù):在相互作用、相互影響的環(huán)境中如何科學(xué)地決策。
第一節(jié)?博弈論和策略行為
博弈論:
定義:研究在策略性環(huán)境中如何進(jìn)行策略性決策和采取策略性行為的科學(xué)。
策略性環(huán)境:每個人進(jìn)行的決策和采取的行動都會對其他人產(chǎn)生顯著的影響;
策略性決策和策略性行動:每個人都要根據(jù)其他人的可能反應(yīng)來決定自己的決策和行動——不同于非策略性的環(huán)境、決策和行動;
作用:分析寡頭廠商行為的一個恰當(dāng)工具;
三個基本要素:
參與人(或稱局中人):在博弈中進(jìn)行決策的主體,參與人通過在博弈中選擇最優(yōu)的決策和行動來使自己的目標(biāo)函數(shù)(如效用或利潤)達(dá)到最大;
參與人的策略:一項規(guī)則,根據(jù)該規(guī)則,參與人在博弈的每一時點上決定如何行動——至少兩個;
參與人的支付:在所有參與人都選擇了各自的策略且博弈已經(jīng)完成之后,參與人所得到的結(jié)果(如效用或利潤)。
分類:
參與人的數(shù)量:二人博弈、多人博弈;
參與人擁有的策略的數(shù)量:有限博弈、無限博弈;
參與人的支付情況:零(常)和博弈、非零(常)和博弈;
參與人是否能夠達(dá)成有效的契約:合作博弈、非合作博弈;
參與人是否了解有關(guān)博弈的所有信息(如所有參與人的策略和支付等):完全信息博弈、非完全信息博弈;
參與人在策略的實施上是否具有“同時性”:靜態(tài)博弈(或同時博弈)、動態(tài)博弈(或序貫博弈);
考慮最后兩個有關(guān)信息和時間的劃分標(biāo)準(zhǔn):完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動態(tài)博弈。
討論對象:參與人為兩個、每個參與人都只有兩個策略的完全信息博弈——
靜態(tài)博弈是參與人同時進(jìn)行決策或行動的博弈;
動態(tài)博弈是參與人的決策和行動有先有后的博弈;
“同時”/“先后”:參與人在決策時是否已經(jīng)知道其他參與人的決策,而并不一定取決于物理意義上的時間。
第二節(jié) 完全信息靜態(tài)博弈:純策略均衡
a.例子:寡頭博弈
關(guān)系:
?甲合作、乙合作:分別得5、6個單位的支付;
甲合作、乙不合作:分別得1、5個單位的支付;
甲不合作、乙合作:分別得7、1個單位的支付;
甲不合作、乙不合作:分別得2、3個單位的支付;
b.支付矩陣
定義:一個只有兩人參加且兩人同時進(jìn)行決策的簡單博弈,可以以二元數(shù)組為元素的矩陣來描述和分析,稱為博弈矩陣或支付矩陣。
c.條件策略和條件策略組合
定義:
條件策略:一個廠商在給定條件下的最優(yōu)策略,叫做該廠商的條件優(yōu)勢策略(或相對優(yōu)勢策略),簡稱條件策略;
條件策略組合:包括參與人的條件策略以及這些條件在內(nèi)的優(yōu)勢策略組合。
d.納什均衡
定義:
均衡:當(dāng)兩個廠商的條件策略組合恰好相同,從而,兩個廠商都不再有單獨改變策略的傾向時,整個博弈就達(dá)到了均衡——博弈均衡時博弈各方最終選取的策略組合,是博弈的最終結(jié)果,是博弈的解;
納什均衡:指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處;兩個問題——
“單獨改變策略”:任何一個參與人在所有其他人都不改變策略的情況下改變自己的策略;
“不會得到好處”:任何一個參與人在單獨改變策略之后這種情況下(即支付不變時),由于存在改變的成本和風(fēng)險,參與人也不愿意單獨改變策略。
e.尋找納什均衡的方法——條件策略下的劃線法
五個步驟:
把整個的支付矩陣分解為甲廠商的支付矩陣和乙廠商的支付矩陣;
在甲廠商的支付矩陣中,找出每一列的最大者(每列的最大者可能不止一個);
在乙廠商的支付矩陣中,找出每一行的最大者(每行的最大者可能不止一個);
將已經(jīng)畫好線的甲廠商的支付矩陣和乙廠商的支付矩陣合并起來,得到一個向量的支付矩陣;
在帶有下劃線的整個支付矩陣中,找到兩個數(shù)字之下均畫有線的支付組合。
f.納什均衡的存在性、唯一性、穩(wěn)定性和最優(yōu)性
f.1存在性
含義:在完全信息靜態(tài)博弈中,(純策略的)納什均衡既可能存在,也可能不存在。
注意:在不存在純策略納什均衡中,兩個廠商對策略的選擇會出現(xiàn)一種永不停歇的周期狀態(tài)。
f.2唯一性
含義:在完全信息靜態(tài)博弈中,如果納什均衡存在,則它既可能是唯一的,也可能是不唯一的。
注意:當(dāng)納什均衡不存在或不唯一時,我們無法對博弈的最終結(jié)果作出肯定的說明。
f.3穩(wěn)定性
含義:在完全信息靜態(tài)博弈中,如果納什均衡存在,則它既可能是穩(wěn)定的,也可能是不穩(wěn)定的。
注意:在存在多個納什均衡的條件下,穩(wěn)定均衡和不穩(wěn)定均衡也可能同時出現(xiàn)。
f.4最優(yōu)性
含義:在完全信息靜態(tài)博弈中,如果納什均衡存在,則它既可能是最優(yōu)的,也可能不是最優(yōu)的。
g.納什均衡和社會福利
g.1囚徒困境和寡頭合作的不穩(wěn)定性
結(jié)論:
納什均衡是存在的;
存在唯一的納什均衡;
只有唯一一個穩(wěn)定的非最優(yōu)納什均衡。
啟示:寡頭市場的一個重要特征,即寡頭廠商之間合作的不穩(wěn)定性——與囚徒困境的情況一樣,寡頭之間這種合作(如共謀壟斷)的不穩(wěn)定性盡管對參與人不利,但有利于促進(jìn)競爭,從而提高整個社會的福利。
g.2廣告大戰(zhàn)
結(jié)論:廣告大戰(zhàn)中,納什均衡不僅對參與人不是最優(yōu)的——因為他們沒有得到都不做廣告的更好的結(jié)果;而且對整個社會不是最優(yōu)的——因為在很大程度上,可口可樂和百事可樂之間的競爭是一種純粹的資源浪費。
第三節(jié) 完全信息靜態(tài)博弈:混合策略均衡
內(nèi)容:即使純策略納什均衡不存在,相應(yīng)的混合策略納什均衡也會存在。
重點:純策略納什均衡往往作為特例包括中混合策略納什均衡中。
a.不存在純策略均衡時的混合策略均衡
a.1混合策略
現(xiàn)實:人們對策略的選擇常常并不是“非此即彼”的,而是以一定的可能性來選擇某個策略。
定義:將”非此即彼“的策略稱為純策略,把它們賦予這些純策略概率的向量叫做混合策略。
特點:與原來的純策略不同,現(xiàn)在的混合策略不再是有限的,而成為無限的,同樣,混合策略組合也不再是有限的,而成為無限的;在一個博弈中,純策略可以是有限的,但以有限的純策略為基礎(chǔ)的混合策略卻一定是無限的——源于概率取值的無限性。
a.2混合策略組合
定義:混合策略的組合。
特點:與純策略組合不同,混合策略組合是一個概率向量組合,其中,每一個概率向量都是相應(yīng)參與人的一個混合策略。
a.3期望支付
背景:在混合策略博弈中,對于每一個混合策略組合,也都存在著一個支付組合,其中,每一項也都是相應(yīng)參與人在該混合策略組合條件下所得到的支付,由于現(xiàn)在每個參與人都是以一定的概率選擇其純策略,故相應(yīng)的支付也就成了所謂的期望支付。
定義:支付的期望值。
a.4條件混合策略
定義:甲廠商在乙廠商選擇某個既定的混合策略時所選擇的可以使其期望支付達(dá)到最大的混合策略。
a.5混合策略的納什均衡
條件:兩個廠商的條件混合策略曲線的交點代表了混合策略博弈的納什均衡。
存在性定理:在每一個參與人都只有有限多個純策略的博弈中,至少存在一個混合策略納什均衡。
b.只有一個純策略均衡時的混合策略均衡
情況:原來的純策略博弈中的納什均衡現(xiàn)在被作為特例包括到了混合策略納什均衡之中,只有一個交點。
c.具有多個純策略均衡時的混合策略均衡
情況:有兩個純策略那是均衡的博弈模型對應(yīng)的兩條曲線有三個交點。
d.具有無窮多個混合策略均衡的博弈
情況:具有任意有限多個純策略的博弈至多存在無窮多個混合策略納什均衡。
第四節(jié) 完全信息動態(tài)博弈
情況:參與人的決策有先有后,特別是,后行動的參與人可以觀察到先行動的參與人已經(jīng)采取了的策略。
a.例子:競爭者—壟斷者博弈
在該博弈中——
競爭者先決策:他決定進(jìn)入還是不進(jìn)入此由壟斷者獨霸的市場;
壟斷者后決策:他根據(jù)競爭者的行動決定對其“容忍”還是“抵抗”。
b.博弈樹
博弈樹
作用:分析完全信息動態(tài)博弈的工具;
名詞:博弈樹模型又稱為擴(kuò)展式博弈模型,以博弈樹來描述的完全信息動態(tài)博弈又叫做擴(kuò)展型博弈;
組成:
起點:初始決策點,通常只有一個,是完全信息動態(tài)博弈開始的地方,是博弈的最先行動或者進(jìn)行決策的地方;
初始決策點向右伸展的兩條線段:競爭者可以采取的兩個行動或策略;
中間點:中間決策點,至少兩個,由于假定在競爭者的初始決策之后緊跟著的是壟斷者的決策,故這些中間決策點都屬于壟斷者;
終點:博弈結(jié)束的地方,不是決策點,不屬于任何參與人,兩層含義——
博弈的一個策略組合;
與某個策略組合相應(yīng)的一個支付組合。
c.納什均衡
定義:參與者都不會單獨改變自己的策略,否則所得支付會下降。
特點:也可能不止一個納什均衡。
d.納什均衡的精煉:逆向歸納法
定義:從眾多的納什均衡中進(jìn)一步確定“更好”的納什均衡。
方法:逆向歸納法——
先從博弈的最后階段的每一個決策點開始,確定相應(yīng)參與人此時所選擇的策略,并把參與人所放棄的其他策略刪除,從而得到博弈的一個簡化博弈;
對簡化博弈重復(fù)第一步驟的程序,直到最后,得到原博弈的一個最簡博弈——原博弈的解。
“先動優(yōu)勢”:先行動者的得益大于后行動者。
完全信息動態(tài)博弈和完全信息靜態(tài)博弈的一個重要的區(qū)別:
當(dāng)博弈是“同時”的時候,如果出現(xiàn)多重納什博弈,常常無法確定最終實現(xiàn)的是哪一個納什均衡;
當(dāng)博弈是“有先有后”的時候,即使納什均衡是多重的,往往也能夠從中確定一個最終的均衡;
原因:與完全信息靜態(tài)博弈相比,完全信息動態(tài)博弈提供了更多的信息——關(guān)于參與人決策秩序的信息。
e.精煉的納什均衡與效率
結(jié)論:對參與人來說,由逆向歸納法“精煉”出來的完全信息動態(tài)博弈的納什均衡也不一定是有效率的。
“蜈蚣博弈”:每個參與人在輪到自己選擇時,總是覺得“賣”,結(jié)果使得博弈“一開始就結(jié)束”——參與人放棄了有可能得到更高凈收益的機(jī)會。