R語言用GAM廣義相加模型研究公交專用道對行程時間變異度數(shù)據(jù)的影響
全文鏈接:http://tecdat.cn/?p=30508
原文出處:拓端數(shù)據(jù)部落公眾號
現(xiàn)實情況是,我們經(jīng)常要處理多個自變量和一個因變量之間的關系,此外,雖然通過做散點圖可以發(fā)現(xiàn)非線性關系,但很難歸因其形式,多項式回歸在廣義線性模型中,由于其不可解釋的系數(shù),降低了模型的有用性。
本文使用的廣義加性模型提供了一種首選方案來研究多個自變量與因變量之間的關系,而無需事先了解因變量和自變量之間的關系,而是使用非線性平滑項來擬合模型。
GAM模型說明
廣義相加模型(GAM:Generalized Additive Model),它模型公式如下:有p個自變量,其中X1與y是線性關系,其他變量與y是非線性關系,我們可以對每個變量與y擬合不同關系,對X2可以擬合局部回歸,X3采用光滑樣條,不必采用統(tǒng)一的關系,而最終結(jié)果‘加’在一起就可以了。

研究目的:
最近我們被要求探討公交專用道,工作日,向西方向,早高峰,停駐時間系數(shù),延誤系數(shù)對行程時間變異度的影響。
預期結(jié)果
所有因素中,公交專用道 對 行程時間變異度 的影響最大,且可以減少行程時間變異度。
變量說明
序號自變量變量類型1公交專用道0.1?變量2工作日0.1 變量3向西方向0.1 變量4早高峰0.1 變量5信號燈離散變量 整數(shù)6延誤系數(shù)連續(xù)變量7行程時間可靠性連續(xù)變量

使用poisson(link = "log")#連接函數(shù)
讓我們使用summary函數(shù)對第一個模型進行診斷。
P值:給定變量對因變量的統(tǒng)計顯著性,通過F檢驗進行檢驗(越低越好)。調(diào)整后的R平方(越高越好)。 s()是樣條函數(shù),括號里面的數(shù)字是定義的自由度,除了使用回歸樣條,還能使用局部樣條lo()函數(shù),得到的結(jié)果與上面的結(jié)果十分類似。

?采用plot()可以將模型畫出來,圖橫坐標為自變量X,縱坐標為因變量Y。
不使用poisson連接函數(shù)
讓我們使用summary函數(shù)進行診斷。

?P值:給定變量對因變量的統(tǒng)計顯著性,通過F檢驗進行檢驗(越低越好)。從結(jié)果可以看到公交專用道對行程時間變異度有顯著影響。



?最受歡迎的見解
1.R語言多元Logistic邏輯回歸 應用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語言泊松Poisson回歸模型分析案例
5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗
6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現(xiàn)
7.在R語言中實現(xiàn)Logistic邏輯回歸
8.python用線性回歸預測股票價格
9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標