最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

想學(xué)博弈論嗎?想獲得魯路修那樣的智商嗎?締結(jié)契約吧,少年!

2017-08-10 15:45 作者:水哥  | 我要投稿

前言:博弈的思想縱橫古今無時(shí)不閃耀在人類智慧的長河中。無論是在田忌賽馬、孫子兵法的古籍里,還是穿越阿爾卑斯的漢尼拔的身影之下,拿破侖坐鎮(zhèn)奧斯特里茨的帷幄之中,我們都能窺以探之博弈的精妙。事實(shí)上,博弈論作為一套初步的科學(xué)理論體系在20世紀(jì)40年代才粉墨登場,其在計(jì)算機(jī)科學(xué)、經(jīng)濟(jì)學(xué)、運(yùn)籌學(xué)等領(lǐng)域有著廣泛應(yīng)用,從華爾街的分析師到硅谷的職業(yè)經(jīng)理人,都或多或少地知道并運(yùn)用著這一古老而又年輕的知識。

  耶魯大學(xué)的校友對“博弈論”一詞一定不會陌生,因?yàn)橐敶髮W(xué)在2007年開設(shè)的經(jīng)濟(jì)學(xué)159號公開課Game Theory(博弈論)被制成視頻分享后,曾在互聯(lián)網(wǎng)上引起學(xué)習(xí)熱潮。說起博弈論中國人一定會想到田忌賽馬,從古至今博弈的思想一直在人類的歷史長河中閃爍其鋒芒,但博弈論作為科學(xué)的理論體系是近代才出現(xiàn)的,它的理論創(chuàng)始人包括大家都熟悉的計(jì)算機(jī)之父——馮·諾依曼?,F(xiàn)如今博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域運(yùn)用尤廣,不論是華爾街的分析師還是硅谷的職業(yè)經(jīng)理人都或多或少地知道并運(yùn)用著這一古老而又年輕的知識。

  約翰?納什因博弈論的重要概念“納什均衡”著稱于世,事實(shí)上他在幾何學(xué)上的成就數(shù)倍于前者,但世人皆因博弈論而認(rèn)識到這位有著悲情曲折人生經(jīng)歷的傳奇科學(xué)家??茖W(xué)家是人類文明的掌燈者,懷念科學(xué)家最好的方式就是重溫其生前的理論和公式,盡管這于常人而言過于復(fù)雜,但任何知識都是由淺及深,我們不妨復(fù)習(xí)一下簡單而又經(jīng)典的功課。

  我們嘗試通過兩個(gè)經(jīng)典例子來幫助初學(xué)者揭開博弈論以及納什均衡的神秘面紗:

  一、普通范式博弈

  GOO公司和SAM公司是某手機(jī)產(chǎn)品生態(tài)的兩大重量級參與者,雙方在產(chǎn)業(yè)鏈的不同位置上各司其職且關(guān)系曖昧,有時(shí)也往往因商業(yè)利益和產(chǎn)品影響力的爭奪而各懷異心。二者的收益也隨著博弈的變化而不斷更替。

  上圖表格模擬了兩家公司的博弈現(xiàn)狀,雙方各有兩個(gè)可選策略“合作”與“背叛”,格中的四組數(shù)據(jù)表示四個(gè)博弈結(jié)局的分?jǐn)?shù)(收益),每組數(shù)據(jù)的第一個(gè)數(shù)字表示GOO公司的收益,后一個(gè)數(shù)字表示SAM公司的收益。

  博弈是同時(shí)進(jìn)行的,一方參與者必須站在對方的角度上來思考我方的策略選擇,以追求收益最大化。這在博弈論里稱作Putting yourselves into other people's shoes(換位思考)。

  現(xiàn)在我們以GOO公司為第一人稱視角來思考應(yīng)對SAM公司的博弈策略。假如SAM公司選擇合作,那么我方也選擇合作帶來的收益是3,而我方選擇背叛帶來的收益是5,基于理性的收益最大化考慮,我方應(yīng)該選擇背叛,這叫嚴(yán)格優(yōu)勢策略;假如SAM公司選擇背叛,那么我方選擇合作帶來的收益是-3,而選擇背叛帶來的收益為-1,為使損失降到最低,我方應(yīng)該選擇背叛。最后,GOO公司的分析結(jié)果是,無論SAM公司選擇合作還是背叛策略,我方都必須選擇背叛策略才能獲得最大化的收益。

  同理,當(dāng)SAM公司也以嚴(yán)格優(yōu)勢策略來應(yīng)對GOO公司的策略選擇時(shí),我們重復(fù)上述分析過程,就能得出結(jié)論:無論GOO公司選擇合作還是背叛策略,SAM公司都必須選擇背叛策略才能獲得最大化收益。

  最后我們發(fā)現(xiàn),本次博弈的雙方都采取了背叛策略,各自的收益都為-1,這是一個(gè)比較糟糕的結(jié)局,盡管對任何一方來說都不是最糟糕的那種。這種局面就是著名的“囚徒困境”。

  但是,博弈的次數(shù)往往不止一次,就像COO與SAM公司雙方的商業(yè)往來也許會有很多機(jī)會。當(dāng)二者經(jīng)歷了多次背叛策略的博弈之后,發(fā)現(xiàn)公式上還有一個(gè)(3,3)收益的雙贏局面,這比(-1,-1)的收益結(jié)果顯然要好很多,因此二者在之后的博弈過程中必然會嘗試互建信任,從而驅(qū)使雙方都選擇合作策略。

  這里有一個(gè)理想化假設(shè),那就是假設(shè)雙方都知道博弈次數(shù)是無限的話,也就是說雙方的商業(yè)往來是無止盡的,那么二者的策略都將持續(xù)選擇合作,最終的博弈收益將定格在(3,3),這就是一個(gè)納什均衡。既然博弈次數(shù)是無限的,那么任何一方都沒有理由選擇背叛策略去冒險(xiǎn)追求5點(diǎn)短暫收益,而招致對方在下一輪博弈中的報(bào)復(fù)(這種報(bào)復(fù)在博弈論里稱作“以牙還牙”策略)。

  還有另一種假設(shè)情況是,假使雙方都知道博弈次數(shù)是有限的,也許下一次博弈就是最后一次,那么為了避免對方在最后一輪博弈中選擇背叛策略而使我方遭受-3的收益損失,于是雙方都重新采取了背叛的策略選擇,最后的博弈結(jié)果又回到了(-1,-1),這就形成了第二個(gè)納什均衡。

  由此可見,隨著次數(shù)(博弈性質(zhì))的變化,納什均衡點(diǎn)也并非唯一,這在下一個(gè)例子中有著更明顯的表現(xiàn)。

  二、餓獅博弈

  題設(shè)為A、B、C、D、E、F六只獅子(強(qiáng)弱從左到右依次排序)和一只綿羊。假設(shè)獅子A吃掉綿羊后就會打盹午睡,這時(shí)比A稍弱的獅子B就會趁機(jī)吃掉獅子A,接著B也會午睡,然后獅子C就會吃掉獅子B,以此類推。那么問題來了,獅子A敢不敢吃綿羊?

  為簡化說明,我們先給出此題的解法。該題須采用逆向分析法,也就是從最弱的獅子F開始分析,依次前推。假設(shè)獅子E睡著了,獅子F敢不敢吃掉獅子E?答案是肯定的,因?yàn)樵讵{子F的后面已沒有其它獅子,所以獅子F可以放心地吃掉午睡中的獅子E。

  繼續(xù)前推,既然獅子E睡著會被獅子F吃掉,那么獅子E必然不敢吃在他前面睡著的獅子D。

  再往前推,既然獅子E不敢吃掉獅子D,那么D則可以放心去吃午睡中的獅子C。依次前推,得出C不吃,B吃,A不吃。所以答案是獅子A不敢吃掉綿羊。

  細(xì)心的人也許會發(fā)現(xiàn),假如增加或減少獅子的總數(shù),博弈的結(jié)果會完全不同。我們用下圖來驗(yàn)證。

  我們在獅子F的后面增加了一只獅子G,總數(shù)變成7只。用逆向分析法按照上題步驟再推一次,很容易得出結(jié)論:獅子G吃,獅子F不吃,E吃,D不吃,C吃,B不吃,A吃。這次的答案變成了獅子A敢吃掉綿羊。

  對比兩次博弈我們發(fā)現(xiàn),獅子A敢不敢吃綿羊取決于獅子總數(shù)的奇偶性,總數(shù)為奇數(shù)時(shí),A敢吃掉綿羊;總數(shù)為偶數(shù)時(shí),A則不敢吃。因此,總數(shù)為奇數(shù)和總數(shù)為偶數(shù)的獅群博弈結(jié)果形成了兩個(gè)穩(wěn)定的納什均衡點(diǎn)。

  總結(jié)

  通過上述兩個(gè)案例的多輪博弈,初學(xué)者應(yīng)該能夠隱約發(fā)現(xiàn)納什均衡的輪廓。當(dāng)博弈次數(shù)不止一次地進(jìn)行著時(shí),博弈結(jié)果將重復(fù)定格在某個(gè)狀態(tài),那個(gè)狀態(tài)即是納什均衡點(diǎn)。公理解釋是如果博弈在某情況下無任一參與者可以通過獨(dú)自行動而增加收益,則此時(shí)的策略組合被稱為納什均衡。

  簡單的博弈案例看上去似乎有趣,但博弈論始終是一門深奧復(fù)雜的學(xué)問,它的復(fù)雜之處就在于博弈分析所用的理想化模型與現(xiàn)實(shí)永遠(yuǎn)存在差異,比如博弈論要求各方參與者必須是經(jīng)濟(jì)學(xué)意義上的“理性人”,而事實(shí)上完全的“理性人”并不存在?,F(xiàn)實(shí)世界存在著太多超出博弈論的變數(shù),這為追求精確預(yù)測的博弈模型構(gòu)建工作帶來難度。

  盡管如此,博弈論仍然改變了世界,成為人類理性認(rèn)識世界的一個(gè)重要工具。而納什均衡的提出無疑豐富了博弈論的理論體系,它是人類文明的一片磚瓦??梢钥隙ǖ氖?,百年之后,人們依然不會忘記約翰?納什的名字,亦不會忘記那個(gè)神奇的納什均衡。

(學(xué)完之后請同學(xué)們對著鏡子照照自己的眼睛是否已經(jīng)開眼Geass,如果沒有說明學(xué)習(xí)不夠,請繼續(xù)課外學(xué)習(xí)。)

本文改編自水哥自己的原創(chuàng)文章《均衡再現(xiàn)!博弈論經(jīng)典案例》,屬于二次原創(chuàng)。轉(zhuǎn)載的同學(xué)請注明作者和出處。

文/水哥 高級工程師,科技專欄作者。微信公眾號:qq133991

想學(xué)博弈論嗎?想獲得魯路修那樣的智商嗎?締結(jié)契約吧,少年!的評論 (共 條)

分享到微博請遵守國家法律
那曲县| 息烽县| 东乡族自治县| 固镇县| 海林市| 陆丰市| 尼木县| 逊克县| 禹城市| 多伦县| 灯塔市| 岳阳市| 双鸭山市| 枞阳县| 宁德市| 胶南市| 政和县| 富裕县| 多伦县| 大邑县| 建阳市| 安顺市| 北安市| 平度市| 孙吴县| 安庆市| 天台县| 赤城县| 咸丰县| 桃园市| 泰州市| 上林县| 合作市| 晋中市| 阿尔山市| 永城市| 新津县| 洛宁县| 云浮市| 西林县| 永德县|