【博弈論】耶魯大學(xué)公開課(中英雙語字幕)

第一到三節(jié)課筆記

Imperfect competition??
行為(自己的&其他人的)影響結(jié)果
博弈論:經(jīng)濟(jì)學(xué) 政治學(xué) 法學(xué) 生物學(xué)(生物進(jìn)化論) 體育
(中間有介紹錄播的回事)
評分標(biāo)準(zhǔn)??
Problem set習(xí)題集
推薦書本??

更難一些??

課本只是救命稻草,課下想深入可以看對應(yīng)章節(jié)。

睡前讀物??

這課有趣,但又有點(diǎn)難:因為學(xué)習(xí)博弈論需要通過一些游戲來學(xué)習(xí)

游戲I(成績博弈)
分為兩兩一組,每個人選擇α或者β
你選α,對手選β,你得A對手C
都選α,都得B-;都選β,都得B+
你選β,對手選α,你得C對手A
博弈論思考方式是像右邊的表格??(矩陣)

涉及行為 策略 參與人(神學(xué):考慮他人)

要了解動機(jī)和收益Payoff,才能真正分析
數(shù)字代表效用或功利??

英格蘭叫法:飯桶惡魔Evil gits (只考慮自己)


從Dominated strategy里面總結(jié):
結(jié)論1?Don't play a strictly dominated strategy
??原因??

如果我在每次選了優(yōu)勢策略dominate it,我在每次博弈都能得到更好的收益。
不管別人怎么選擇,我總得到更好的結(jié)果。
??漏洞:不管我選了什么,都不會/會影響你。
在超現(xiàn)實(shí)狀態(tài)了。
??漏洞:如果我說服你選β,我選擇α,那么我可以收獲3效用
就算上條可行,我仍然選擇α
結(jié)論2?Rational Choice can lead to outcomes that"Suck"(美國人說的“糟糕”)

在經(jīng)濟(jì)學(xué)里面,會導(dǎo)致Inefficient=Pareto Inefficient
都不選擇最壞就會是次優(yōu)
著名案例:囚徒困境Prisoner's Dilemma
eg.期末、年末的時候,寢室會亂,因為沒有人打掃,都指望別人。
離婚糾紛??

經(jīng)濟(jì)學(xué)案例??Price War

怎么化解???
1.Collusion串通-Contract合同(Illegal 無效)
2.Enforceable強(qiáng)制性
3.重復(fù)--可以達(dá)成協(xié)議 溝通 互相相信
(我想到石頭剪刀布也是同理)
神學(xué)院
收益不同?
列出可能的收益Possible Playoff

就叫(起名)Evil gits 飯桶惡魔??(只考慮自己)
和 Indignant angels憤怒的天使(考慮別人)

由于罪惡感最后從收益3到-1 道德譴責(zé)



??這種叫做“協(xié)和謬誤Coordination Problem”
?注意收益的重要性
?結(jié)論:收益很重要
在博弈中當(dāng)一件事情參與者已經(jīng)投入了一定的成本和精力之后,發(fā)現(xiàn)進(jìn)行下去的結(jié)果是不易進(jìn)行下去的低效率,低回報時,卻因各種因素而不停止事件的進(jìn)行,繼續(xù)做這件事,此時便是 博弈論 中的“協(xié)和謬誤”。(搜狗百科)【有點(diǎn)像SUNK COST】

??邏輯上不成立
因為很多可能想要的東西,在不經(jīng)意之間就來了。
(但是知道想要的才會更好追求)-收益很重要。
混搭
局內(nèi)人和??
你是??Evil git,對方是??Indignant angel
α dominates β(總比后面好)

??根據(jù)對手的最優(yōu)來決定我的選擇
4?博弈最重要的是“換位思考”
Put yourself into some's shoes

現(xiàn)實(shí)中
再玩一個游戲
本節(jié)課的五個結(jié)論:
- Don't play a strictly dominated strategy不要選擇劣勢策略
- Rational choices can lead to bad outcomes理性選擇會導(dǎo)致次優(yōu)的結(jié)果
- Put yourself in other people's shoes學(xué)會換位思考
- You can't get what you want你無法得到你想要的
- 不要相信耶魯?shù)膶W(xué)生
???????????????????
回顧

先是矩陣寫出結(jié)果
知道收益Payoff才能進(jìn)行博弈
??屬于“Normal-Form Game”
In game theory, normal form is a description of a game. Unlike extensive form, normal-form representations are not graphical per se, but rather represent the game by way of a matrix. While this Approach can be of greater use in identifying strictly dominated strategies and Nash equilibria, some information is lost as compared to extensive-form representations. The normal-form representation of a game includes all perceptible and conceivable strategies, and their corresponding payoffs, for each player.
*博弈論與現(xiàn)實(shí)世界是緊密聯(lián)系的
Has some real world relevance.
Prisoner's Dilemma囚徒困境?
和別人要進(jìn)行合作項目
價格競爭
不管對手怎么做,都想削弱他們
雙方逗采用這樣的策略,那么價格將會下降到邊際成本,行業(yè)利潤會遭受損失。

- 1?大家都想偷懶,結(jié)果不堪設(shè)想
- 2?兩家企業(yè)相互削弱,最終壓低價格?對消費(fèi)者有利,但是企業(yè)不利
- 3?加入有一個可利用的公共資源(魚群 新鮮空氣 全球變暖 碳排放)

*存在溝通問題 但溝通并不能化解囚徒困境
一直都有動機(jī) 指望別人

- ??可以簽訂協(xié)議 置頂規(guī)章制度=改變動機(jī)和結(jié)果就是好的
- 用教育來改變收益* 要慎用
最接近全班2/3的那個游戲
結(jié)果留下懸念
Formal Stuff
博弈的Ingredients要素
1?Players參與人:i j
*規(guī)定 表述法
2?策略:si(表示i 的某個策略)
*區(qū)分特定策略和可能策略
用Si表示set of alternatives(參與人i 的所有可能策略的集合)
eg.上次課的游戲
策略的集合是:從1 2 3到100
s表示一次博弈 所有人的都在一個電子表格
稱為Strategy profile策略組合(策略向量Strategy Vector/策略列表Strategy list)
表示每個參與人都有一個對應(yīng)的策略--數(shù)字游戲的電子表格spreadsheet/游戲中的一個樣本
3?收益U
U for utile,to the Player i 's payoff
符號U表示參與人的收益,取決于參與人1的策略
Ui will depend on Player 1's choices
所有都影響參與人I的收益 一直到參與人N的策略
Ui由所有的參與人的策略決定(包括他自己)
簡寫是Ui(s)由策略組合決定
在數(shù)字博弈中Ui(s)代表這兩件事

很可能是平局tie

s-i 表示除了i外 其參與人的策略

不要因為數(shù)學(xué)恐懼或者數(shù)學(xué)符號恐懼而放棄這門課
舉個例子
博弈有兩個參與人 I II
I有兩種選擇:上和下
II有三種選擇:左中右
(5,-1)(11,3)(0,0)
(6,4)(0,2)(0,2)

Strategy set:
SI:{T,B}
SII:{L,C,R}?

上不總是優(yōu)于下,反之亦然
Another Example

si strategy is weakly dominated by her strategy
si
當(dāng)且僅當(dāng)無論對手怎么做
if player i 's payoff from choosing "si"against"s-i"
她選擇si的收益至少與選si的相等

1-100的游戲
剔除
dominated處于劣勢:>67(全部人選擇100的話,66才是平均數(shù)的2/3)
因為去除了68-100(運(yùn)用了第一結(jié)論 不要用劣勢策略)
所以45-67也剔除了(從別人的角度換位思考)

30-45在原來不是劣勢,去除之后變成了劣勢策略

接著就是20+的數(shù)字

自己是Rational,對方也是Rational
要讓自己有理性KR(Rationality)

Common knowledge: I know ,you know I know,I know you know I know you know...
Then optimal choice will be 1.

Mutual knowledge doesn't imply common knowledge.
這個過程被叫做“迭代剔除劣勢策略”

換位思考 從對手的角度入手 推測意圖(相互的)
*所有人的劣勢策略一次又一次剔除
政治領(lǐng)域中著名的立場選擇問題

需要&解決平局問題

競選者=玩家
政治立場=策略
盡可能最大化獲得選票=收益

規(guī)律:立場2總比立場1多5%

政治里的經(jīng)典模型 Prediction:candidates and the voters
“Median Voter Theorem”中間選民定理

所以:會選擇與對手相近的政治立場,相當(dāng)中立

現(xiàn)實(shí)里面:肯尼迪和尼克松1960年競選(政治)
美國歷史說明這個策略有效
經(jīng)濟(jì)學(xué)里面的模型:
表現(xiàn)為firm's crowding together to try to get shoppers who are close to them
Application:Product Placement
eg.加油站?? 更傾向于集中在路口吸引更多加油
Anthony Downs (政治)寫本著作
Hotelling霍特林 寫篇論文1992
Evaluation:多位 不堅定立場/不一定相信 不能每個人都投票或者參與 占比不平均/不平均分配

建立模型:更好地描述事實(shí)激發(fā)靈感
模型總是抽象的,要看看有沒有疏漏
看一些遺漏的影響因素并且如何影響
發(fā)生在英國的97年八九十年代的事情(不相信)
在這里沒有劣勢策略,所以前面的模型不奏效了

選上是對手選左的最佳對策
選擇左邊,中間是最佳對策









