《10堂概率極簡課》標注
?
間接押注的總成本是P(p)+P(q)。根據(jù)相關性,直接押注的成本應該等于間接押注的成本:P(p或q)=P(p)+P(q)。如果等號兩邊不相等,那么顯然有可能被人利用,以賤買貴賣的方式實施荷蘭賭。在滿足模型假設條件的情況下,相關性從本質上看就是指可通過不止一種方式實現(xiàn)的賭博協(xié)議能夠得出一致的估算結果。
?
第四個問題。A向B承諾:如果B用一枚普通的骰子,第一輪就擲出6點,A就給B一枚硬幣;如果B第二輪擲出6點,A就給B兩枚硬幣;如果B第三輪擲出6點,A就給B三枚硬幣;如果B第四輪擲出6點,A就給B 4枚硬幣,以此類推。請問B的期望值是多少?第五個問題。問題同上,但是A承諾付給B的硬幣數(shù)目不是按照1、2、3、4、5…這樣的規(guī)律增長,而是按照像1、2、4、8、16…或者1、3、9、27…或者1、4、9、16、25…或者1、8、27、64…這樣的規(guī)律遞增。盡管這些問題大多不難解答,但你會有一些非常奇怪的發(fā)現(xiàn)。蒙特莫特回答道,這些問題并不難,只要求出無窮級數(shù)的和即可,而“你的伯父雅各布·伯努利早就給出了這類級數(shù)的求和方法”。尼古拉·伯努利在回信中建議蒙特莫特親自試一試。雖然第四個問題中的無窮級數(shù)之和是6,但第五個問題中的幾個無窮級數(shù)之和都是無窮大。這就是伯努利所說的“非常奇怪的發(fā)現(xiàn)”。這樣的結果意味著什么呢?這個賭博游戲的期望值怎么會大于所有的有限和呢?
?
克萊姆認為效用是金錢的平方根;伯努利則認為金錢增量產生的效用與已經(jīng)擁有的金錢數(shù)量成反比,財富的派生效用等于財富數(shù)量的對數(shù)。接著,伯努利又對風險厭惡進行了描述,并討論了購買保險的合理性。
?
?
如果股票價格的對數(shù)真的像布朗運動那樣波動,研究布朗運動就可以預測和確定股票價格?;谶@樣的假設,數(shù)學家和經(jīng)濟學家推導出定價公式,比如布萊克–斯科爾斯期權定價模型[邁倫·斯科爾斯(Myron Scholes)和羅伯特·默頓(Robert Merton)因為這項成果獲得1997年的諾貝爾經(jīng)濟學獎]。
?
?
貝葉斯的前輩們,包括伯努利和棣莫弗,都是根據(jù)概率來推斷頻率,而貝葉斯則是根據(jù)頻率來推斷概率,從而為統(tǒng)計推斷奠定了數(shù)學基礎。
?
?
?
貝葉斯的動力似乎不是源自法律、醫(yī)學等實際事務,而是與數(shù)學哲學問題有關
?
?
從這個角度看,這個方法似乎可以用作大衛(wèi)·休謨問題的答案。休謨在1748年出版的《人類理解研究》中寫道:
盡管世界上并不存在概率這種事物,但由于我們不知道任何事件的真實原因,因此我們的無知對理解產生了同樣的影響,并產生了一種類似的信念或觀點。……我們在做一切推斷時,都會在習慣的支配下將過去的經(jīng)驗套用到將來的頭上。因此,如果一件事在過去充滿規(guī)律性和一致性,我們就會信心十足地預期未來它也是這樣,而不會做任何相反的假設。但是,如果我們發(fā)現(xiàn)多個不同的結果是由表面上非常相似的原因造成的,當我們把過去的經(jīng)驗套用到將來的頭上時,這些結果就會浮現(xiàn)在我們的腦海里,我們在決定那個事件發(fā)生的概率時,也肯定會考慮到它們。雖然我們會傾向于最常見的結果,并且相信這種結果肯定會發(fā)生,但我們也不應當忽略其他結果。當然,我們必須按照它們發(fā)生頻率的多少,賦予每個結果或多或少的權重和信度。
?
?
哈爾·帕施勒和克里斯汀·哈里斯在《心理科學》雜志關于復制研究的特刊上發(fā)表了一篇文章,指出心理學領域關于效力與先驗的假設不可謂不合理,但與5%的p值相結合,就會導致真實效果的概率不到一半。流行病學領域在分析某個效果的概率時可能需要考慮許多相關因素,但由于先驗概率較低,情況可能要糟糕得多。此外,人們還可能通過某些主動的方式得到期望的p值。有的是因為操作出了問題,因此某些輪次的實驗被視為失敗。有的實驗者盡管做出了努力,但因為沒有取得效果,所以無法公開發(fā)表實驗結果。在這種情況下,純噪聲遲早會達到統(tǒng)計顯著性水平,實驗結果也得以順利發(fā)表。又或者是實驗者修改假設,以便從數(shù)據(jù)中得到一個理想的p值。這種做法被稱為p值操縱。
?
?
貝葉斯的哲學理念改變了世界。關于概率,我們都有一個先驗。我們獲取數(shù)據(jù),運用貝葉斯定理更新概率,最終得到一個后驗。在獲取數(shù)據(jù)之前,我們把已知的一切信息都歸到對未知的先驗之中。然后,我們輸入數(shù)據(jù)并更新。這個一般性方法的應用范圍很廣,不僅限于拋硬幣或擲骰子。我們未知的事物可能是向量、曲線或者圖形的發(fā)生概率。當分析遭遇瓶頸時,我們可以使用漸進法或蒙特·卡羅模擬法。
?
當時,阿蘭·圖靈領導的一個小組破解了德國海軍的恩尼格碼。此前英國人試圖根據(jù)字母出現(xiàn)的頻率來破解該密碼,但沒有成功。而圖靈采用了貝葉斯技術,在某些情況下還進行了創(chuàng)新,取得了不錯的效果。有的信息——比如電文來源,發(fā)送的具體時間,電文長度是否與為了迷惑英國人而發(fā)送的標準“噪聲”電文相同,同一名發(fā)報員是否總以相同長度的報尾結束電文——對老式的解碼技術而言是毫無作用的。
?
?
貝葉斯的偉大思想是,通過給不同的概率分布Pi指定一個先驗分布πi,使統(tǒng)計學成為概率的一個組成部分。
?
?
我們以拋擲一枚真實的圖釘為例。如果圖釘落地后針尖朝上,則計1;如果它落地后針尖指向地面,則計0。在經(jīng)典的貝葉斯分析中,θ表示單次拋擲后針尖朝上的概率,它是未知的。假設θ的先驗是均勻的,圖釘已被拋擲了10次,而且從未出現(xiàn)針尖朝上的結果。那么,在接下來的10次拋擲中,不會出現(xiàn)針尖朝上的結果的概率是多少?經(jīng)典計算表明,這個概率大約為1/2(11/21)。假設把數(shù)字10換成n。在n次實驗未取得成功的情況下,接下來的n次實驗也不會成功的概率是多少?無論之前未成功實驗的次數(shù)是多少,答案同樣約為1/2,即(n+1)/(2n+1)。如果這個答案在令我們吃驚之余還讓我們感到失望,就說明我們假設的均勻先驗可能是存疑的。這個答案讓哈羅德·杰弗里斯和多蘿西·林奇憂心忡忡,為此他們嘗試了各種各樣的先驗。他們建議為0和1這兩個位置分別賦予某個先驗概率質量。如果賦予0的先驗概率是1/3,賦予1的先驗概率是1/3,而且兩者之間的概率是均勻的,那么在已知前10次失敗的情況下,接下來失敗10次的概率超過90%
?
?
在貝葉斯理論中,偏倚先驗是由表示定理決定的。我們把這種估算先驗概率稱作菲尼蒂先驗。如果你對結果序列的置信度具有某種對稱性,即可交換性,那么這些結果序列就好像是由偏倚未知、有菲尼蒂先驗的拋硬幣概率模型得到的。因此,只要我們的置信度具有可交換性,即使我們認為概率不存在,應用貝葉斯的數(shù)學方法也不會有任何問題。
?
?
貝葉斯是參數(shù)貝葉斯分析之父。他分析的概率模型——獨立、同分布的拋硬幣序列,有一個未知參數(shù)——硬幣的偏倚。我們可以為這個參數(shù)賦予一個先驗置信度,然后利用反向推理,由數(shù)據(jù)得出一個后驗置信度和新的預期數(shù)據(jù)。盡管貝葉斯本人并沒有這樣做,但他揭示了機會、頻率和置信度是如何相互作用并給出統(tǒng)計推斷的。菲尼蒂是主觀貝葉斯分析之父。他將對稱這個古老的概念應用于置信度,指出貝葉斯概率模型的元素都可以被視為對稱的手工藝品,即可交換性。對于不具有可交換性的情況,菲尼蒂給出了適用于較弱對稱性的相同概念:馬爾可夫可交換性和更具一般性的部分可交換性。概率成了適當對稱性的一種位置標記。
?
?
什么是對稱?它是經(jīng)過一組變換后保持不變的特征,這是赫爾曼·外爾在一部經(jīng)典著作中對這個概念給出的明確解釋。[插圖]某些特征經(jīng)旋轉或反射后仍保持不變,這是物理對稱性的常見標志。一般而言,我們有一個狀態(tài)的集合和一個由其可測子集構成的集合。如果每個可測集合A與它的逆像T–1(A)的概率相同,那么概率測度相對于一個變換群(或半群)保持不變。隨機過程相對于時間變化保持不變,這是一種特別重要的對稱,具有這種特征的隨機過程被稱為平穩(wěn)隨機過程。如果變換將可測集變成其自身(概率為0的集合除外),那么該可測集相對于該變換保持不變。如果不變集的概率為1或0,那么概率測度相對于該變換具有遍歷性。遍歷分解定理認為,每個不變概率都可以表示成遍歷概率的平均值(混合)。具體來說,遍歷分解定理告訴我們平穩(wěn)過程可以表示成多個遍歷過程的混合。二值隨機變量序列的可交換概率——對實驗進行有限排列時保持不變——是固定的。遍歷分解概率使拋硬幣的結果為獨立同分布,這與菲尼蒂表示定理沒有任何區(qū)別
?
?
更復雜的隨機數(shù)生成器使用的是高階遞歸函數(shù)。Xn+ 1=Xn–24·Xn–55 (mod 232–1)是隨機數(shù)生成器的一個早期經(jīng)典案例,也是本書作者最喜歡的一個,該程序啟動所需的種子X1, X2, …, X55?,F(xiàn)代最流行的生成器——梅森旋轉算法,也采用類似的隨機數(shù)生成方案。這些方案有效嗎?答案既是肯定的,也是否定的。對某些任務來說,比如求積分和玩電腦游戲,這些方案通常很有效。
?
人們曾利用幾種新的經(jīng)過改進的隨機數(shù)生成方案,求解一個統(tǒng)計物理問題的若干常見實例的結果。通過解析,人們已經(jīng)知道該問題的正確解,但這些隨機數(shù)生成方案卻都失敗了。今天的老虎機使用的就是上文中描述的那些簡單生成器,據(jù)我們所知,這個事實已被賭場騙子掌握并加以利用。他們通過數(shù)百次的觀察,了解拉下拉桿的結果,繼而洞悉了N和f(i)的秘密。之后,根據(jù)當前的X(n),就可以推斷出X(n+1), X(n+2), …。他們在賭場伺機而動,等到累計獎金金額非常高時,就會“一不小心”把咖啡灑在正在玩老虎機的玩家身上。(“哎呀,衣服清洗費算我的,請收下這個50美元的籌碼吧?!保H缓?,他們就會堂而皇之地坐到那臺老虎機前,拉動拉桿,滿載而歸。關于銀行詐騙和計算機系統(tǒng)遭黑客入侵的報道也不絕于耳。
?
?
歸納懷疑論的經(jīng)典陳述來自大衛(wèi)·休謨,盡管他會讓我們想起它的古老淵源。休謨問道,我們如何驗證歸納推理的合理性呢?它不能通過意識關系——數(shù)學演繹——來證明:“太陽明天不會升起”的命題和“太陽明天會升起”的命題,都是可以理解的。因此,如果我們試圖證明它是錯誤的,必將徒勞無功。
?
?
除了可交換性,置信度可能還有其他對稱性,這些對稱性通常會產生某些歸納結果。對稱性減弱,讓步于順序效應,并產生馬爾可夫可交換性。順序效應不僅限于此,還包含不同類型的時間順序和時空順序。一般來說,置信度的對稱性是進行各種類比推理的原因。菲尼蒂早在1938年就提出了這一觀點,后來該觀點被多次發(fā)展完善。
?