石頭剪刀布,如果得分不同怎么玩(上)

感謝@喬木心心,在我的文章《1A2B猜數(shù)字游戲(bulls and cows)》下提到的這個創(chuàng)意!!

這位兄臺在構(gòu)想一個游戲,石頭剪刀布系統(tǒng)只是其中一部分,還有其他有意思的系統(tǒng)!這里只提取石頭剪刀布系統(tǒng),并對其進行了簡化,只討論“如果石頭剪刀布得分不同怎么玩”。
由于我水平有限,以下只能算我嘗試解題的記錄、學習筆記,像“納什均衡”等概念都是第一次接觸,可能發(fā)生理解錯誤、計算錯誤、表述錯誤等,最后結(jié)論也不確定對,歡迎指正!

1. 根據(jù)@喬木心心 的構(gòu)想,簡化再簡化后的問題:
5(布)勝0(石頭),得5分。
0(石頭)勝2(剪刀),得2分。
2(剪刀)勝5(步),得7分。
有沒有可以取得最優(yōu)解的策略?

2. 囚徒困境——純策略納什平衡
我發(fā)現(xiàn)知乎有人問了類似的問題“石頭剪刀布勝負不同權(quán)重會導致什么策略解?”。根據(jù)“Richard Xu”的解答,我知道了“純策略納什均衡”和“混合策略納什均衡”這兩名詞。[1]
然后百度百科“納什平衡”里面有個經(jīng)典案例是囚徒困境。[2]
以下是百度百科“納什平衡”詞條里復制過來的:
囚徒困境
(1950年,數(shù)學家塔克任斯坦福大學客座教授,在給一些心理學家作講演時,講到兩個囚犯的故事。)
假設有兩個小偷A和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。
我在B站搜了李永樂老師有沒有講過這個,還真有:


3.?純策略/混合策略/納什平衡/純策略納什平衡/混合策略納什平衡
根據(jù)百度百科“納什平衡”[2]和問答庫中一篇考研仿真模擬題里面的答案[3],我自己總結(jié)了(理解和表述不一定對):
純策略:確定每個情況要做的特定的選擇,并且始終堅持這一選擇? 的策略,比如堅持出石頭
混合策略:按確定的概率選擇不同的純策略? 的策略,比如堅持50%出石頭、50%出剪刀
純策略算混合策略的一種,有一個純策略占100%,比如100%出石頭。
納什平衡:無論對方的策略選擇如何,博弈中所有博弈者都會選擇某個確定的策略。每個博弈者都是為了達到自己期望收益的最大值,任何博弈者單獨改變其策略都不會得到好處。
純策略納什平衡:所有博弈者都用純策略。任何博弈者單獨改變其純策略都不會得到好處。
混合策略納什平衡:至少有一位博弈者用混合策略。任何博弈者單獨改變其選擇純策略的概率都不會得到好處。
囚徒困境有純策略納什均衡,即A選擇坦白、B選擇坦白,如果有人單獨改變策略,那他豈不是要從關(guān)八年變成關(guān)十年,沒有好處。
我們這里“石頭剪刀布得分不同”好像沒有純戰(zhàn)略納什平衡,只有混合策略納什平衡。
我搜的時候,一會策略一會戰(zhàn)略,一會平衡一會均衡,應該是一個東西,我盡量統(tǒng)一寫平衡和策略,可能會哪里疏忽了產(chǎn)生兩種表述。

4. 硬幣正反——混合策略納什平衡
百度百科“納什平衡”里面還有個案例是硬幣正反。[2]
以下是百度百科“納什平衡”詞條里復制過來的:
硬幣正反
你正在圖書館枯坐,一位陌生美女主動過來和你搭訕,并要求和你一起玩?zhèn)€數(shù)學游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了?!蹦敲丛摬辉摵瓦@位姑娘玩這個游戲呢?這基本是廢話,當然該。問題是,這個游戲公平嗎?
每一種游戲依具其規(guī)則的不同會存在兩種納什平衡,一種是純策略納什平衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什平衡,而在這個游戲中,便應該采用混合策略納什平衡。
為什么要有“你正在圖書館枯坐,一位陌生美女主動過來和你搭訕”這個背景啊23333,這個百度百科詞條里好像沒看見出處,時間緊迫我也沒搜到出處。
在百度百科里,這個案例的解題過程還挺詳細的:


啊啊啊時間緊迫我分上下了,抱歉QAQ!
由于我水平有限,以上只能算我嘗試解題的記錄、學習筆記,像“納什均衡”等概念都是第一次接觸,可能發(fā)生理解錯誤、計算錯誤、表述錯誤等,最后結(jié)論也不確定對,歡迎指正!
大家在家無聊可以玩一玩得分不同的石頭剪刀布,強行聯(lián)系文集主題并放入文集。

參考
[1]?“石頭剪刀布勝負不同權(quán)重會導致什么策略解?”,知乎,https://www.zhihu.com/question/38868420
[2] “納什平衡”,百度百科,https://baike.baidu.com/item/%E7%BA%B3%E4%BB%80%E5%B9%B3%E8%A1%A1/1325910
[3] “2017年云南師范大學805西方經(jīng)濟學(含微觀經(jīng)濟學、宏觀經(jīng)濟學)之西方經(jīng)濟學(微觀部分)考研仿真模擬題”,問答庫,https://www.asklib.com/view/96a7e138762.html

廣告時間(大家來看看就好了,不必勉強,不點贊也沒關(guān)系,謝啦):
