拓端tecdat|R語言用泊松Poisson回歸、GAM樣條曲線模型預(yù)測(cè)騎自行車者的數(shù)量
原文鏈接:http://tecdat.cn/?p=18550?
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
?
我根據(jù)泊松Poisson回歸、GAM樣條曲線模型對(duì)一個(gè)十字路口的騎自行車者的數(shù)量進(jìn)行預(yù)測(cè),
str(base)
'data.frame': 214 obs.
$ 日期 ? ?: chr ?"1-Apr" "2-Apr" "3-Apr7" "4-Apr" ...
$ 最高溫度 ?: num ?46 62.1 63 51.1 63 48.9 48 55.9 66 73.9 ...
$ 最低溫度 ? : num ?37 41 50 46 46 41 43 39.9 45 55 ...
$ 降雨量 ?: num ?0 0 0.03 1.18 0 0.73 0.01 0 0 0 ...
$ 數(shù)量: int ?606 2021 2470 723 2807 461 1222 1674 2375 3324 ...
$ 溫差 ?: num ?9 21.1 13 5.1 17 7.9 5 16 21 18.9 ......
使用Poisson回歸預(yù)測(cè)周日、周一有多少騎自行車的人,天氣情況是溫度85F-70F沒有下雨。我們創(chuàng)建一個(gè)預(yù)測(cè)數(shù)據(jù)框。
newbase = data.frame(DAY=as.factor(
最高溫度=c(85,85),最低溫度=c(70,70,
降雨量=c(0,0))
讓我們創(chuàng)建一個(gè)包含所有解釋變量的模型。
我們還添加一個(gè)虛擬變量來指示不下雨的日子,
summary(reg)
Coefficients:
Estimate Std. Error z value Pr(|z|)
(Intercept) ? ? ? ? 6.8844970 ?0.0110463 623.241 ? 2e-16 ***
最高溫度 ? ? ? ? ? ? ?0.0210950 ?0.0003133 ?67.328 ? 2e-16 ***
最低溫度 ? ? ? ? ? ? ?-0.0114006 ?0.0003351 -34.024 ? 2e-16 ***
降雨量 ? ? ? ? ? ?-0.6570450 ?0.0071899 -91.384 ? 2e-16 ***
I(降雨量 == 0)TRUE ?0.1303908 ?0.0033283 ?39.176 ? 2e-16 ***
---
Signif. codes: ?0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 70021 ?on 213 ?degrees of freedom
Residual deviance: 26493 ?on 203 ?degrees of freedom
AIC: 28580
Number of Fisher Scoring iterations: 4
所以變量似乎都顯著。如果我們要檢查非線性效應(yīng),可以將樣條曲線放在所有連續(xù)變量上
gam(數(shù)量~bs(最高溫度)+bs(最低溫度)+bs(降雨量)+I(降雨量==0),poisson
?

最高溫度或最低溫度

以及下面的降雨量曲線,最大觀測(cè)值(3)與之前觀測(cè)值(1.8)之間的線性平滑

?
我們還可以回歸最小溫度,以及最大和最小溫度之間的溫差(在線性模型中,模型是等效的,但是通過非線性變換,可以更簡(jiǎn)單地給出差異)
?

現(xiàn)在,我們可以比較這四個(gè)模型及其預(yù)測(cè)。例如,對(duì)于線性模型(虛擬變量表示沒有下雨),
predict(reg,newdata=newbase,type="response se.fit=TRUE
對(duì)于星期一,我們獲得λ的95%置信區(qū)間
P$fit[1]+c(-2,2)*P$se.fit[1]
[1] 3349.842 3401.395
對(duì)于星期日,95%置信區(qū)間為
[1] 2987.497 3033.861
我們可以可視化四個(gè)模型的置信區(qū)間

?
而周日,我們有

?
換句話說,通過更改模型,我們對(duì)預(yù)測(cè)的置信區(qū)間進(jìn)行了更改(有時(shí)區(qū)間完全不相交)。

最受歡迎的見解
1.R語言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語言泊松Poisson回歸模型分析案例
5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)
6.r語言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)
7.在R語言中實(shí)現(xiàn)Logistic邏輯回歸
8.python用線性回歸預(yù)測(cè)股票價(jià)格
9.R語言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)
?