拓端tecdat|R語(yǔ)言貝葉斯Poisson泊松-正態(tài)分布模型分析職業(yè)足球比賽進(jìn)球數(shù)
原文鏈接:http://tecdat.cn/?p=23099?
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
在本文關(guān)于如何在R中進(jìn)行貝葉斯分析。我們介紹貝葉斯分析,這個(gè)例子是關(guān)于職業(yè)足球比賽的進(jìn)球數(shù)。
模型
首先,我們認(rèn)為職業(yè)足球比賽的進(jìn)球數(shù)來(lái)自分布

,其中θ是平均進(jìn)球數(shù)?,F(xiàn)在假設(shè)我們用一位足球?qū)<业囊庖?jiàn)來(lái)得出足球比賽的平均進(jìn)球數(shù),即參數(shù)θ,我們得到:

。
curve(dnorm(x, 2.5, 0.2), from = -2, to = 8,...)
?

我們想知道什么?
在這種情況下,我們想知道θ的后驗(yàn)分布是什么樣子的,這個(gè)分布的平均值是什么。為了做到這一點(diǎn),我們將在三種情況下分析:
我們有1個(gè)觀察值x=1,來(lái)自分布為

的總體。
我們有3個(gè)觀測(cè)值x=c(1,3,5),來(lái)自一個(gè)具有

分布的總體。
我們有10個(gè)觀測(cè)值x=c(5,4,3,4,3,2,7,2,4,5),來(lái)自一個(gè)具有

分布的總體。
理論方法
在這里,我想告訴你貝葉斯分析是如何分析的。首先,我們有一個(gè)來(lái)自具有未知參數(shù)θ的泊松分布的人口的似然函數(shù)。?
?

我們知道參數(shù)θ的先驗(yàn)分布p(θ)是由以下公式給出的。

?最后,θ的后驗(yàn)分布為。
?

?其中常數(shù)C的計(jì)算方法如下。

而后驗(yàn)分布E(θ|x)的平均值由以下公式給出。

計(jì)算方法
在這里,你將學(xué)習(xí)如何在R中使用蒙特卡洛模擬來(lái)回答上面提出的問(wèn)題。對(duì)于這三種情況,你將遵循以下步驟。
1. 定義數(shù)據(jù)
首先,你需要根據(jù)方案定義數(shù)據(jù)。
x <- 1 #第一種情況
2. 計(jì)算常數(shù)C
現(xiàn)在使用蒙特卡洛模擬來(lái)計(jì)算積分。為此,有必要從先驗(yàn)分布中產(chǎn)生N=10000個(gè)值θi,并在似然函數(shù)

中評(píng)估它們。最后,為了得到C,這些值被平均化。R中的代碼如下。?
N <- 100000 ?# 模擬值的數(shù)量
rnorm(n=N, mean = 2.5, sd = 0.2) #先驗(yàn)分布
prod(dpois(x=x, lambda = theta)) #似然函數(shù)

3. 尋找后驗(yàn)分布
計(jì)算完C后,你可以得到后驗(yàn)分布,如下所示。
? ? ? ? fvero(theta) * dnorm(x=theta) / C
?
4. 計(jì)算后驗(yàn)分布的平均數(shù)
最后你可以使用蒙特卡洛模擬計(jì)算積分來(lái)獲得后驗(yàn)分布的平均值。?
integral <- mean(aux)
posterior <- integral/C?

結(jié)果
如前所述,上面介紹的代碼用于所有三種情況,唯一根據(jù)情況變化的是x。在這一節(jié)中,我們將為每種情況展示一張圖,其中包含θ的先驗(yàn)和后驗(yàn)分布、后驗(yàn)分布的平均值(藍(lán)色虛線)和觀測(cè)值(粉紅色的點(diǎn))。
第一種情況
curve(dnorm(x, 2.5, 0.2), col=4,,x=x, y=rep(0, length(x)),
line,v = mposterior,legend=c("topright", legend=c("后驗(yàn)", "先驗(yàn)"),)
?

?
第二種情況
?
?

?
第三種情況

?
結(jié)論
從結(jié)果中我們可以得出這樣的結(jié)論:當(dāng)我們有很少的觀測(cè)數(shù)據(jù)時(shí),如圖1和圖2,由于缺乏樣本證據(jù),后驗(yàn)分布將傾向于類似于先驗(yàn)分布。相反,當(dāng)我們有大量的觀測(cè)數(shù)據(jù)時(shí),如圖3,后驗(yàn)分布將偏離先驗(yàn)分布,因?yàn)閿?shù)據(jù)將有更大的影響。
我希望你喜歡這篇文章并了解貝葉斯統(tǒng)計(jì)。我鼓勵(lì)你用其他分布運(yùn)行這個(gè)程序。

最受歡迎的見(jiàn)解
1.R語(yǔ)言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語(yǔ)言泊松Poisson回歸模型分析案例
5.R語(yǔ)言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)
6.r語(yǔ)言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)
7.在R語(yǔ)言中實(shí)現(xiàn)Logistic邏輯回歸
8.python用線性回歸預(yù)測(cè)股票價(jià)格
9.R語(yǔ)言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)