最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

拓端tecdat|R語(yǔ)言貝葉斯Poisson泊松-正態(tài)分布模型分析職業(yè)足球比賽進(jìn)球數(shù)

2021-08-05 10:55 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=23099?

原文出處:拓端數(shù)據(jù)部落公眾號(hào)

在本文關(guān)于如何在R中進(jìn)行貝葉斯分析。我們介紹貝葉斯分析,這個(gè)例子是關(guān)于職業(yè)足球比賽的進(jìn)球數(shù)。

模型

首先,我們認(rèn)為職業(yè)足球比賽的進(jìn)球數(shù)來(lái)自分布

,其中θ是平均進(jìn)球數(shù)?,F(xiàn)在假設(shè)我們用一位足球?qū)<业囊庖?jiàn)來(lái)得出足球比賽的平均進(jìn)球數(shù),即參數(shù)θ,我們得到:

curve(dnorm(x, 2.5, 0.2), from = -2, to = 8,...)

?

我們想知道什么?

在這種情況下,我們想知道θ的后驗(yàn)分布是什么樣子的,這個(gè)分布的平均值是什么。為了做到這一點(diǎn),我們將在三種情況下分析:

我們有1個(gè)觀察值x=1,來(lái)自分布為

的總體。
我們有3個(gè)觀測(cè)值x=c(1,3,5),來(lái)自一個(gè)具有

分布的總體。
我們有10個(gè)觀測(cè)值x=c(5,4,3,4,3,2,7,2,4,5),來(lái)自一個(gè)具有

分布的總體。

理論方法

在這里,我想告訴你貝葉斯分析是如何分析的。首先,我們有一個(gè)來(lái)自具有未知參數(shù)θ的泊松分布的人口的似然函數(shù)。?

?

我們知道參數(shù)θ的先驗(yàn)分布p(θ)是由以下公式給出的。

?最后,θ的后驗(yàn)分布為。

?

?其中常數(shù)C的計(jì)算方法如下。

而后驗(yàn)分布E(θ|x)的平均值由以下公式給出。

計(jì)算方法

在這里,你將學(xué)習(xí)如何在R中使用蒙特卡洛模擬來(lái)回答上面提出的問(wèn)題。對(duì)于這三種情況,你將遵循以下步驟。

1. 定義數(shù)據(jù)

首先,你需要根據(jù)方案定義數(shù)據(jù)。

x <- 1 #第一種情況

2. 計(jì)算常數(shù)C

現(xiàn)在使用蒙特卡洛模擬來(lái)計(jì)算積分。為此,有必要從先驗(yàn)分布中產(chǎn)生N=10000個(gè)值θi,并在似然函數(shù)

中評(píng)估它們。最后,為了得到C,這些值被平均化。R中的代碼如下。?

  1. N <- 100000 ?# 模擬值的數(shù)量

  2. rnorm(n=N, mean = 2.5, sd = 0.2) #先驗(yàn)分布

  3. prod(dpois(x=x, lambda = theta)) #似然函數(shù)



3. 尋找后驗(yàn)分布

計(jì)算完C后,你可以得到后驗(yàn)分布,如下所示。


  1. ? ? ? ? fvero(theta) * dnorm(x=theta) / C


?

4. 計(jì)算后驗(yàn)分布的平均數(shù)

最后你可以使用蒙特卡洛模擬計(jì)算積分來(lái)獲得后驗(yàn)分布的平均值。?

  1. integral <- mean(aux)

  2. posterior <- integral/C?


結(jié)果

如前所述,上面介紹的代碼用于所有三種情況,唯一根據(jù)情況變化的是x。在這一節(jié)中,我們將為每種情況展示一張圖,其中包含θ的先驗(yàn)和后驗(yàn)分布、后驗(yàn)分布的平均值(藍(lán)色虛線)和觀測(cè)值(粉紅色的點(diǎn))。

第一種情況

  1. curve(dnorm(x, 2.5, 0.2), col=4,,x=x, y=rep(0, length(x)),

  2. line,v = mposterior,legend=c("topright", legend=c("后驗(yàn)", "先驗(yàn)"),)

?

?

第二種情況
?

?

?

第三種情況

?

結(jié)論

從結(jié)果中我們可以得出這樣的結(jié)論:當(dāng)我們有很少的觀測(cè)數(shù)據(jù)時(shí),如圖1和圖2,由于缺乏樣本證據(jù),后驗(yàn)分布將傾向于類似于先驗(yàn)分布。相反,當(dāng)我們有大量的觀測(cè)數(shù)據(jù)時(shí),如圖3,后驗(yàn)分布將偏離先驗(yàn)分布,因?yàn)閿?shù)據(jù)將有更大的影響。

我希望你喜歡這篇文章并了解貝葉斯統(tǒng)計(jì)。我鼓勵(lì)你用其他分布運(yùn)行這個(gè)程序。

最受歡迎的見(jiàn)解

1.R語(yǔ)言多元Logistic邏輯回歸 應(yīng)用案例

2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語(yǔ)言泊松Poisson回歸模型分析案例

5.R語(yǔ)言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)

6.r語(yǔ)言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)

7.在R語(yǔ)言中實(shí)現(xiàn)Logistic邏輯回歸

8.python用線性回歸預(yù)測(cè)股票價(jià)格

9.R語(yǔ)言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)


拓端tecdat|R語(yǔ)言貝葉斯Poisson泊松-正態(tài)分布模型分析職業(yè)足球比賽進(jìn)球數(shù)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
灵璧县| 温州市| 靖边县| 那曲县| 永新县| 柘荣县| 乌拉特后旗| 班玛县| 马尔康县| 兴山县| 霍邱县| 海口市| 元谋县| 凭祥市| 兖州市| 龙山县| 西乌珠穆沁旗| 芷江| 安福县| 时尚| 黄梅县| 孝义市| 黔江区| 依安县| 阿瓦提县| 五河县| 华池县| 绥滨县| 德昌县| 晴隆县| 武邑县| 晋州市| 绥芬河市| 蓬溪县| 达尔| 山阴县| 福清市| 化州市| 平昌县| 南郑县| 静海县|