拓端tecdat|R語言廣義加性模型GAMs分析溫度、臭氧環(huán)境數(shù)據(jù)繪制偏回歸圖與偏殘差圖
原文鏈接:? http://tecdat.cn/?p=23697
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
我們使用R庫mgcv,用廣義加性模型(GAMs)對(duì)環(huán)境數(shù)據(jù)進(jìn)行建模。mgcv是一個(gè)偉大的庫,具有豐富的功能,但我們經(jīng)常發(fā)現(xiàn),默認(rèn)的診斷圖并不令人振奮。特別是偏殘差圖,功能很強(qiáng),但不漂亮,殘差幾乎看不見。我們需要根據(jù)這些代碼來制作自己的偏回歸平滑圖。
1) 基本的數(shù)據(jù)設(shè)置
我們正在使用這里討論的數(shù)據(jù)集。我們使用的是國家發(fā)病率和死亡率空氣污染研究(NMMAPS)的數(shù)據(jù)。我們將數(shù)據(jù)限制在1997-2000年。
data[date>as.Date("1996-12-31"),]
2) 簡(jiǎn)單的GAM模型--溫度對(duì)臭氧
在這個(gè)例子中,我們保持模型的簡(jiǎn)單性--使用高斯數(shù)據(jù),單一預(yù)測(cè)因子。我們對(duì)溫度與臭氧進(jìn)行建模,我們將輸出默認(rèn)的偏殘差圖。
# 模型 - 溫度對(duì)臭氧的影響
plot(gam)
這個(gè)圖可以改進(jìn)?
3) 重新制作偏殘差圖
偏殘差圖(Partial Residual?Plot)是多元回歸中常用的診斷工具,特別是評(píng)估模型中在一個(gè)或另一個(gè)解釋變量中是否包含非線性項(xiàng)。在多元回歸y=β0+β1x1+…+βpxp+ε中,若欲反映其中變量Xj與因變量y之間的關(guān)系并用圖形顯示,其方法之一是用偏殘差圖。
在這里,我們加入平滑項(xiàng)、置信區(qū)間和偏殘差。
#我們可以在多邊形的頂部添加線條
qplot(temp, fit, type="n")+poly(c(temp, rev(temp)),
c(low95,rev(up95))# 對(duì)于置信度的灰色多邊形
在最后一步,我們要加入偏殘差本身。偏殘差是平滑項(xiàng)的估計(jì)值+整個(gè)模型的殘差。
#添加偏殘差。
points(temp,partial.resids)
為便于參考,這里是完整模型的摘要。
模型 - 溫度對(duì)臭氧的影響?
最受歡迎的見解
1.R語言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語言泊松Poisson回歸模型分析案例
5.R語言混合效應(yīng)邏輯回歸Logistic模型分析肺癌
6.r語言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)
7.R語言邏輯回歸、Naive Bayes貝葉斯、決策樹、隨機(jī)森林算法預(yù)測(cè)心臟病
8.python用線性回歸預(yù)測(cè)股票價(jià)格
9.R語言用邏輯回歸、決策樹和隨機(jī)森林對(duì)信貸數(shù)據(jù)集進(jìn)行分類預(yù)測(cè)