拓端tecdat|R語(yǔ)言基于Bootstrap的線(xiàn)性回歸預(yù)測(cè)置信區(qū)間估計(jì)方法
原文鏈接:http://tecdat.cn/?p=21625?
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
我們知道參數(shù)的置信區(qū)間的計(jì)算,這些都服從一定的分布(t分布、正態(tài)分布),因此在標(biāo)準(zhǔn)誤前乘以相應(yīng)的t分值或Z分值。但如果我們找不到合適的分布時(shí),就無(wú)法計(jì)算置信區(qū)間了嗎?幸運(yùn)的是,有一種方法幾乎可以用于計(jì)算各種參數(shù)的置信區(qū)間,這就是BootsTRAP 法。
本文使用BOOTSTRAP來(lái)獲得預(yù)測(cè)的置信區(qū)間。我們將在線(xiàn)性回歸基礎(chǔ)上討論。

這是一個(gè)單點(diǎn)預(yù)測(cè)。當(dāng)我們想給預(yù)測(cè)一個(gè)置信區(qū)間時(shí),預(yù)測(cè)的置信區(qū)間取決于參數(shù)估計(jì)誤差。
預(yù)測(cè)置信區(qū)間
讓我們從預(yù)測(cè)的置信區(qū)間開(kāi)始

藍(lán)色值是通過(guò)在我們的觀測(cè)數(shù)據(jù)庫(kù)中重新取樣獲得的可能預(yù)測(cè)值。值得注意的是,在殘差正態(tài)性假設(shè)下(回歸線(xiàn)的斜率和常數(shù)估計(jì)值),置信區(qū)間(90%)如下所示:

在這里,我們可以比較500個(gè)生成數(shù)據(jù)集上的值分布,并將經(jīng)驗(yàn)分位數(shù)與正態(tài)假設(shè)下的分位數(shù)進(jìn)行比較,

可以看出,經(jīng)驗(yàn)分位數(shù)與正態(tài)假設(shè)下的分位數(shù)是可以比較的。
感興趣變量的可能值
現(xiàn)在讓我們看看另一種類(lèi)型的置信區(qū)間,關(guān)于感興趣變量的可能值。這一次,除了提取新樣本和計(jì)算預(yù)測(cè)外,我們還將在每次繪制時(shí)添加噪聲,以獲得可能的值。

在這里,我們可以(首先以圖形方式)比較通過(guò)重新取樣獲得的值和在正態(tài)假設(shè)下獲得的值,

數(shù)值上給出了以下比較
這一次,右側(cè)有輕微的不對(duì)稱(chēng)。顯然,我們不能假設(shè)高斯殘差,因?yàn)橛懈蟮恼?,而不是?fù)值??紤]到數(shù)據(jù)的性質(zhì),這是有意義的(制動(dòng)距離不能是負(fù)數(shù))。
然后開(kāi)始討論在供應(yīng)中使用回歸模型。為了獲得具有獨(dú)立性,有人認(rèn)為必須使用增量付款的數(shù)據(jù),而不是累計(jì)付款。
可以創(chuàng)建一個(gè)數(shù)據(jù)庫(kù),解釋變量是行和列。
然后,我們可以從基于對(duì)數(shù)增量付款數(shù)據(jù)的回歸模型開(kāi)始,該模型基于對(duì)數(shù)正態(tài)模型
這與鏈?zhǔn)教荻确ǖ慕Y(jié)果略有不同,但仍然具有可比性。我們也可以嘗試泊松回歸(用對(duì)數(shù)鏈接)
預(yù)測(cè)結(jié)果與鏈?zhǔn)教荻确ǖ玫降墓烙?jì)值吻合??藙谒埂な┟芴兀↘laus Schmidt)和安吉拉·溫什(Angela Wünsche)于1998年在鏈?zhǔn)教荻确ā⑦呺H和最大似然估計(jì)中建立了與最小偏差方法的聯(lián)系。

最受歡迎的見(jiàn)解
1.R語(yǔ)言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語(yǔ)言泊松Poisson回歸模型分析案例
5.R語(yǔ)言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)
6.r語(yǔ)言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)
7.在R語(yǔ)言中實(shí)現(xiàn)Logistic邏輯回歸
8.python用線(xiàn)性回歸預(yù)測(cè)股票價(jià)格
9.R語(yǔ)言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)