R語言使用bootstrap和增量法計(jì)算廣義線性模型(GLM)預(yù)測置信區(qū)間|附代碼數(shù)據(jù)
原文鏈接:http://tecdat.cn/?p=15062
最近我們被客戶要求撰寫關(guān)于廣義線性模型的研究報(bào)告,包括一些圖形和統(tǒng)計(jì)輸出。
考慮簡單的泊松回歸

。給定的樣本

,其中


,目標(biāo)是導(dǎo)出用于一個(gè)95%的置信區(qū)間

給出

,其中

是預(yù)測。
?
因此,我們要導(dǎo)出預(yù)測的置信區(qū)間,而不是觀測值,即下圖的點(diǎn)
> r=glm(dist~speed,data=cars,family=poisson)
> P=predict(r,type="response",
+ newdata=data.frame(speed=seq(-1,35,by=.2)))
> plot(cars,xlim=c(0,31),ylim=c(0,170))
> abline(v=30,lty=2)
> lines(seq(-1,35,by=.2),P,lwd=2,col="red")
> P0=predict(r,type="response",se.fit=TRUE,
+ newdata=data.frame(speed=30))
> points(30,P1$fit,pch=4,lwd=3)
?
即

?
最大似然估計(jì)

。

,F(xiàn)isher信息來自標(biāo)準(zhǔn)最大似然理論。

這些值的計(jì)算基于以下計(jì)算

在對(duì)數(shù)泊松回歸的情況下,

讓我們回到最初的問題。
線性組合的置信區(qū)間
獲得置信區(qū)間的第一個(gè)想法是獲得置信區(qū)間

(通過取邊界的指數(shù)值)。漸近地,我們知道

因此,方差矩陣的近似將基于通過插入?yún)?shù)的估計(jì)量而獲得。
然后,由于作為漸近多元分布,參數(shù)的任何線性組合也將是正態(tài)的,即具有正態(tài)分布。所有這些數(shù)量都可以輕松計(jì)算。首先,我們可以得到估計(jì)量的方差
因此,如果我們與回歸的輸出進(jìn)行比較,
> summary(reg)$cov.unscaled(Intercept) ? ? ? ? speed
(Intercept) ?0.0066870446 -3.474479e-04speed ? ? ? -0.0003474479 ?1.940302e-05> V[,1] ? ? ? ? ?[,2][1,] ?0.0066871228 -3.474515e-04[2,] -0.0003474515 ?1.940318e-05
根據(jù)這些值,很容易得出線性組合的標(biāo)準(zhǔn)偏差,
一旦我們有了標(biāo)準(zhǔn)偏差和正態(tài)性,就得出了置信區(qū)間,然后,取邊界的指數(shù),就得到了置信區(qū)間
> segments(30,exp(P2$fit-1.96*P2$se.fit),
+ 30,exp(P2$fit+1.96*P2$se.fit),col="blue",lwd=3)
?
基于該技術(shù),置信區(qū)間不再以預(yù)測為中心。

?
點(diǎn)擊標(biāo)題查閱往期內(nèi)容

R語言廣義線性模型GLM、多項(xiàng)式回歸和廣義可加模型GAM預(yù)測泰坦尼克號(hào)幸存者

左右滑動(dòng)查看更多

01

02
03
04
增量法
實(shí)際上,使用表達(dá)式作為置信區(qū)間不會(huì)喜歡非中心區(qū)間。因此,一種替代方法是使用增量方法。我們可以使用一個(gè)程序包來計(jì)算該方法,而不是在理論上再次寫一些東西,
> P1$fit1
155.4048$se.fit1
8.931232$residual.scale[1] 1
?
增量法使我們具有(漸近)正態(tài)性,因此一旦有了標(biāo)準(zhǔn)偏差,便可以得到置信區(qū)間。
?
通過兩種不同的方法獲得的數(shù)量在這里非常接近
> exp(P2$fit-1.96*P2$se.fit)1
138.8495> P1$fit-1.96*P1$se.fit1
137.8996> exp(P2$fit+1.96*P2$se.fit)1
173.9341> P1$fit+1.96*P1$se.fit1
172.9101
bootstrap技術(shù)
第三種方法是使用bootstrap技術(shù)基于漸近正態(tài)性(僅50個(gè)觀測值)得出這些結(jié)果。我們的想法是從數(shù)據(jù)集中取樣,并對(duì)這些新樣本進(jìn)行l(wèi)og-Poisson回歸,并重復(fù)很多次數(shù),
?
?
點(diǎn)擊文末?“閱讀原文”
獲取全文完整代碼數(shù)據(jù)資料。
本文選自《R語言使用bootstrap和增量法計(jì)算廣義線性模型(GLM)預(yù)測置信區(qū)間》。
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
R語言廣義線性模型GLM、多項(xiàng)式回歸和廣義可加模型GAM預(yù)測泰坦尼克號(hào)幸存者
R語言廣義線性模型(GLM)、全子集回歸模型選擇、檢驗(yàn)分析全國風(fēng)向氣候數(shù)據(jù)
R語言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
R語言用潛類別混合效應(yīng)模型(Latent Class Mixed Model ,LCMM)分析老年癡呆年齡數(shù)據(jù)
R語言貝葉斯廣義線性混合(多層次/水平/嵌套)模型GLMM、邏輯回歸分析教育留級(jí)影響因素?cái)?shù)據(jù)R語言估計(jì)多元標(biāo)記的潛過程混合效應(yīng)模型(lcmm)分析心理測試的認(rèn)知過程
R語言因子實(shí)驗(yàn)設(shè)計(jì)nlme擬合非線性混合模型分析有機(jī)農(nóng)業(yè)施氮水平
R語言非線性混合效應(yīng) NLME模型(固定效應(yīng)&隨機(jī)效應(yīng))對(duì)抗哮喘藥物茶堿動(dòng)力學(xué)研究
R語言用線性混合效應(yīng)(多水平/層次/嵌套)模型分析聲調(diào)高低與禮貌態(tài)度的關(guān)系
R語言LME4混合效應(yīng)模型研究教師的受歡迎程度R語言nlme、nlmer、lme4用(非)線性混合模型non-linear mixed model分析藻類數(shù)據(jù)實(shí)例
R語言混合線性模型、多層次模型、回歸模型分析學(xué)生平均成績GPA和可視化
R語言線性混合效應(yīng)模型(固定效應(yīng)&隨機(jī)效應(yīng))和交互可視化3案例
R語言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級(jí)調(diào)查數(shù)據(jù)R語言 線性混合效應(yīng)模型實(shí)戰(zhàn)案例
R語言混合效應(yīng)邏輯回歸(mixed effects logistic)模型分析肺癌數(shù)據(jù)
R語言如何用潛類別混合效應(yīng)模型(LCMM)分析抑郁癥狀
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言建立和可視化混合效應(yīng)模型mixed effect model
R語言LME4混合效應(yīng)模型研究教師的受歡迎程度
R語言 線性混合效應(yīng)模型實(shí)戰(zhàn)案例
R語言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言如何解決線性混合模型中畸形擬合(Singular fit)的問題
基于R語言的lmer混合線性回歸模型
R語言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測驗(yàn)建立層次(分層)貝葉斯模型
R語言分層線性模型案例
R語言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測驗(yàn)(SAT)建立分層模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM
R語言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測驗(yàn)建立層次(分層)貝葉斯模型
SPSS中的多層(等級(jí))線性模型Multilevel linear models研究整容手術(shù)數(shù)據(jù)
用SPSS估計(jì)HLM多層(層次)線性模型模型