馬同學圖解數(shù)學-如何理解貝葉斯定理?
讓我們從一個故事開始。
1 看著后視鏡往前開車

想象這么一個場景,我開著車,經(jīng)過筆直的大道,快速地往下一個路口駛去。我知道,到了下一個路口就要右轉了。
這件事情很簡單,我坐在駕駛室內(nèi),看到下一個路口,往右邊打方向盤就好了:

突然,不管什么原因(這故事是我寫的,可以安排一百種原因,干脆就不解釋),反正前擋風玻璃碎了:

不要糾結我這幅圖,反正你已經(jīng)無法看清前面的路了,那怎么知道什么時候該右轉?
還好,開車的是一位數(shù)學家,智商及時上線。
數(shù)學家根據(jù)自己的經(jīng)驗,估計這條筆直的道路上:

這也就意味著如果隨意的右轉,有95%的概率是錯誤的。
數(shù)學家從后視鏡看出去,發(fā)現(xiàn)后面有一輛車在打右轉彎燈,他意識到:

新的信息出現(xiàn)了,此時如果右轉,錯誤的概率就比之前小很多。
這種思考方法,就是貝葉斯定理所闡述的思考方法。
2 結合開車來理解貝葉斯公式

我們來看看貝葉斯公式是怎么寫的:
??
先把剛才的開車給符號化:

我們再來理解下貝葉斯公式:

因此貝葉斯公式實際上闡述了這么一個事情:

我們再通過韋恩圖來理解一下這個事情(為了觀看方便,下面的,
的圓形面積是示意):


新的信息的出現(xiàn),比如之前看到了亮著右轉彎燈的車,就好比知道點已經(jīng)落入了。
至于為什么事件發(fā)生后導致的調整為:
這就需要代數(shù)了,推導也不復雜,這里就不演算了。
2.1 小結
我們可以看到有形的十字路口,卻看不到明天是否下雨,我們可以看到前方是否有路障,卻不清楚下一次飛機是否會出事。甚至有時候,眼睛還會欺騙我們。
很多時候,我們不得不看著后視鏡開車,這個時候概率論、貝葉斯定理就是我們的指路明燈。
看著后視鏡開車,肯定常常會撞車,沒關系,我們可以不斷的去修正我們的假設。
比如,撞了幾次車之后,就發(fā)現(xiàn)可能之前估計的在十字路口打右轉彎燈的數(shù)據(jù)明顯偏大了,我們修正之后再繼續(xù)開車。我們?nèi)祟惖膶W習,本身也是一個試錯的過程。
3 貝葉斯定理與人腦

貝葉斯定理現(xiàn)在很多人在研究,就是因為不少人相信貝葉斯定理和人腦的工作機制很像(此處頗多爭論,望自行判斷),因此成為機器學習的基礎。
比如,你和對方聊天的時候,如果對方說出“雖然”兩個字,你大概就會猜測,對方后繼九成的可能性會說出“但是”。我們的大腦看起來就好像是天生在用貝葉斯定理。
吳軍博士在他的著作《數(shù)學之美》里面就提到了,最早的自然語言處理,比如翻譯、語音識別,都是通過語法分析來進行的,就是把“主謂賓”分析清楚,然后處理,正確率慘不忍睹。
后來,google由自然語言處理專家賈里尼克領導的部門,通過統(tǒng)計、概率方法進行上述研究,正確率提高了很多。在書中也列舉了貝葉斯定理是如何參與自然語言處理的。
書中還有一句業(yè)界廣為流傳的名言:

語法是人類后來總結出來的,我們天生是不需要語法就可以開口說話的,或許,人腦真的是貝葉斯大腦。
最后,有一個小小的問題,根據(jù)我們的經(jīng)驗,硬幣正反兩面出現(xiàn)的概率都是50%,如果我扔了一千次都是正面,那說明了什么?

看圖學數(shù)學!馬同學提供微積分、線性代數(shù)、概率論與數(shù)理統(tǒng)計、機器學習等知識講解。深入淺出,形象生動,歡迎同學加入學習(微信公眾號:馬同學高等數(shù)學)?