最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

石頭剪刀布,如果得分不同怎么玩(上)

2020-01-26 23:53 作者:百分百美味手抓餅  | 我要投稿

感謝@喬木心心,在我的文章《1A2B猜數(shù)字游戲(bulls and cows)》下提到的這個創(chuàng)意!!

喬木心心的評論截圖,感謝!

這位兄臺在構(gòu)想一個游戲,石頭剪刀布系統(tǒng)只是其中一部分,還有其他有意思的系統(tǒng)!這里只提取石頭剪刀布系統(tǒng),并對其進行了簡化,只討論“如果石頭剪刀布得分不同怎么玩”。

由于我水平有限,以下只能算我嘗試解題的記錄、學習筆記,像“納什均衡”等概念都是第一次接觸,可能發(fā)生理解錯誤、計算錯誤、表述錯誤等,最后結(jié)論也不確定對,歡迎指正!

1. 根據(jù)@喬木心心 的構(gòu)想,簡化再簡化后的問題:

5(布)勝0(石頭),得5分。

0(石頭)勝2(剪刀),得2分。

2(剪刀)勝5(步),得7分。

有沒有可以取得最優(yōu)解的策略?

2. 囚徒困境——純策略納什平衡

我發(fā)現(xiàn)知乎有人問了類似的問題“石頭剪刀布勝負不同權(quán)重會導致什么策略解?”。根據(jù)“Richard Xu”的解答,我知道了“純策略納什均衡”和“混合策略納什均衡”這兩名詞。[1]

然后百度百科“納什平衡”里面有個經(jīng)典案例是囚徒困境。[2]

以下是百度百科“納什平衡”詞條里復制過來的:

囚徒困境

(1950年,數(shù)學家塔克任斯坦福大學客座教授,在給一些心理學家作講演時,講到兩個囚犯的故事。)

假設有兩個小偷A和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。

我在B站搜了李永樂老師有沒有講過這個,還真有:

3.?純策略/混合策略/納什平衡/純策略納什平衡/混合策略納什平衡

根據(jù)百度百科“納什平衡”[2]和問答庫中一篇考研仿真模擬題里面的答案[3],我自己總結(jié)了(理解和表述不一定對):

純策略:確定每個情況要做的特定的選擇,并且始終堅持這一選擇? 的策略,比如堅持出石頭

混合策略:按確定的概率選擇不同的純策略? 的策略,比如堅持50%出石頭、50%出剪刀

純策略算混合策略的一種,有一個純策略占100%,比如100%出石頭。

納什平衡:無論對方的策略選擇如何,博弈中所有博弈者都會選擇某個確定的策略。每個博弈者都是為了達到自己期望收益的最大值,任何博弈者單獨改變其策略都不會得到好處。

純策略納什平衡:所有博弈者都用純策略。任何博弈者單獨改變其純策略都不會得到好處。

混合策略納什平衡:至少有一位博弈者用混合策略。任何博弈者單獨改變其選擇純策略的概率都不會得到好處。

囚徒困境有純策略納什均衡,即A選擇坦白、B選擇坦白,如果有人單獨改變策略,那他豈不是要從關(guān)八年變成關(guān)十年,沒有好處。

我們這里“石頭剪刀布得分不同”好像沒有純戰(zhàn)略納什平衡,只有混合策略納什平衡。

我搜的時候,一會策略一會戰(zhàn)略,一會平衡一會均衡,應該是一個東西,我盡量統(tǒng)一寫平衡和策略,可能會哪里疏忽了產(chǎn)生兩種表述。

4. 硬幣正反——混合策略納什平衡

百度百科“納什平衡”里面還有個案例是硬幣正反。[2]

以下是百度百科“納什平衡”詞條里復制過來的:

硬幣正反

你正在圖書館枯坐,一位陌生美女主動過來和你搭訕,并要求和你一起玩?zhèn)€數(shù)學游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了?!蹦敲丛摬辉摵瓦@位姑娘玩這個游戲呢?這基本是廢話,當然該。問題是,這個游戲公平嗎?

每一種游戲依具其規(guī)則的不同會存在兩種納什平衡,一種是純策略納什平衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什平衡,而在這個游戲中,便應該采用混合策略納什平衡。

為什么要有“你正在圖書館枯坐,一位陌生美女主動過來和你搭訕”這個背景啊23333,這個百度百科詞條里好像沒看見出處,時間緊迫我也沒搜到出處。

在百度百科里,這個案例的解題過程還挺詳細的:

百度百科“納什平衡”里“硬幣正反”的解題過程截圖

啊啊啊時間緊迫我分上下了,抱歉QAQ!

由于我水平有限,以上只能算我嘗試解題的記錄、學習筆記,像“納什均衡”等概念都是第一次接觸,可能發(fā)生理解錯誤、計算錯誤、表述錯誤等,最后結(jié)論也不確定對,歡迎指正!


大家在家無聊可以玩一玩得分不同的石頭剪刀布,強行聯(lián)系文集主題并放入文集。

參考

[1]?“石頭剪刀布勝負不同權(quán)重會導致什么策略解?”,知乎,https://www.zhihu.com/question/38868420

[2] “納什平衡”,百度百科,https://baike.baidu.com/item/%E7%BA%B3%E4%BB%80%E5%B9%B3%E8%A1%A1/1325910

[3] “2017年云南師范大學805西方經(jīng)濟學(含微觀經(jīng)濟學、宏觀經(jīng)濟學)之西方經(jīng)濟學(微觀部分)考研仿真模擬題”,問答庫,https://www.asklib.com/view/96a7e138762.html

廣告時間(大家來看看就好了,不必勉強,不點贊也沒關(guān)系,謝啦):


石頭剪刀布,如果得分不同怎么玩(上)的評論 (共 條)

分享到微博請遵守國家法律
侯马市| 双柏县| 通化县| 天水市| 通江县| 施甸县| 沁阳市| 朝阳区| 呼玛县| 巴南区| 双桥区| 盐山县| 高密市| 桦甸市| 睢宁县| 平阳县| 班戈县| 海南省| 本溪市| 青冈县| 剑川县| 仙居县| 陇南市| 达州市| 邻水| 辽阳市| 碌曲县| 库车县| 岚皋县| 黄石市| 翼城县| 荥经县| 绥江县| 枝江市| 常宁市| 津南区| 冷水江市| 伽师县| 石首市| 远安县| 华坪县|