R語言分位數(shù)回歸、最小二乘回歸OLS北京市GDP影響因素可視化分析
全文鏈接:http://tecdat.cn/?p=32372
原文出處:拓端數(shù)據(jù)部落公眾號
對于影響北京市GDP 因素分析常用的方法是最小二乘回歸?!?】但最小二乘有自身的缺陷,該方法要求較高,例如許多觀測數(shù)據(jù)很難滿足全部假設(shè)條件。相比普通最小二乘法只能描述協(xié)變量對因變量條件均值變化的影響,分位數(shù)回歸能精確地描述協(xié)變量對于因變量的變化范圍和分布形狀的影響?!?】隨著計算機技術(shù)的不斷突破,分位數(shù)回歸軟件包現(xiàn)已是主流統(tǒng)計軟件R、SAS等中的座上客了,分位數(shù)回歸也就自然而然地成為經(jīng)濟、醫(yī)學、教育等領(lǐng)域的常用分析工具?!?】
客戶主要研究是先利用分位數(shù)回歸研究收斂性,然后和最小二乘做個比較。
研究意義
作為一種精確地描述自變量對于因變量的變化范圍以及條件分布影響的統(tǒng)計方法,分位數(shù)回歸的概念最早由Koenker和Basset(t1978)【4】提出。借助Laplace(1818)提出的最小絕對殘差估計思想,他們針對最小二乘回歸的某些缺陷,創(chuàng)建了線性分位數(shù)回歸理論。Bassett(1986)【5】、Powell(1986)【6】和Chernozhuko(2002)【7】等人在此基礎(chǔ)上進行了深入的研究,陸續(xù)解決了分位數(shù)回歸的線性假設(shè)檢驗、異方差的穩(wěn)健性檢驗、估計量的一致性和線性規(guī)劃解法等應(yīng)用方面的難題,使其成為了近幾十年來發(fā)展較快、應(yīng)用廣泛的回歸模型方法。分位數(shù)回歸可以提供不同分位點處的估計結(jié)果,因此可以對因變量的整個分配情況作出更為清楚的闡釋?!?】不同分位數(shù)下的參數(shù)估計量往往也不同,這就表明同樣的影響因素對處在不同水平的研究對象的作用大小是不同的。特別是在研究對象的分布呈現(xiàn)異質(zhì)性,如不對稱,截斷性等特征時,這一方法往往能夠提供更為詳盡的信息,具有明顯的優(yōu)勢。【9】
文獻綜述
分位數(shù)回歸是對以古典條件均值模型為基礎(chǔ)的最小二乘法的延伸,它用幾個分位函數(shù)來估計整體模型。分位數(shù)回歸更能精確地描述自變量X對于因變量Y的變化范圍以及條件分布形狀的影響。分位數(shù)回歸能夠捕捉分布的尾部特征,當自變量對不同部分的因變量的分布產(chǎn)生不同的影響時。【10】
對于分位數(shù)回歸模型,則可采取線性規(guī)劃法(LP)估計其最小加權(quán)絕對偏差,從而得到解釋變量的回歸系數(shù),可表示如下:

求解得:

研究的基本內(nèi)容,擬解決的主要問題
研究的主要內(nèi)容:
1.?? 對北京市1995~2014年的GDP、投資、消費等增長率進行統(tǒng)計;
2.?? 建立分位數(shù)回歸模型;
3.?? 討論模型的穩(wěn)健性、處理數(shù)據(jù)異質(zhì)性、各種收斂性;
4.?? 針對不同的收斂性進行分析和比較;
5.?? 通過與最小二乘法的對比研究其優(yōu)勢。
研究步驟
1.????? 搜集北京市近二十年經(jīng)濟增長等數(shù)據(jù);
2.????? 學習并了解分位數(shù)回歸分析問題的研究背景及應(yīng)用;
3.????? 建立分位數(shù)回歸模型;
4.????? 利用模型與統(tǒng)計軟件進行計算,觀察其特性;
5.????? 與最小二乘法進行比較,得出結(jié)論。
查看數(shù)據(jù)

讀取數(shù)據(jù)
head(data)

σ收斂的檢驗

從變異系數(shù)的變化趨勢來看,在06年以后,波動趨勢變小,因此參數(shù)逐漸收斂。
β-收斂的分位數(shù)回歸分析
ggplot(dat, aes(x,y)) + geom_point() + geom_smooth(method="lm")

建立分位數(shù)回歸模型
qr1 <- rq





qr1$coefficients

與ols回歸線段作比較
summary(OLS)

OLS(普通二乘回歸)

上圖是普通二乘回歸的擬合圖,從結(jié)果來看大部分點被回歸預測的置信區(qū)間所覆蓋。然后有少量點在置信區(qū)間之外。
分位數(shù)回歸擬合直線

分位數(shù)回歸圖
從分位數(shù)回歸的結(jié)果來看,所有數(shù)據(jù)均被分位數(shù)回歸模型的預測區(qū)間所覆蓋。因此模型比普通二乘更好。

上面的圖為分位數(shù)回歸的回歸系數(shù)變化趨勢圖,從結(jié)果來看居民消費水平的相關(guān)影響逐漸變化且從負相關(guān)變?yōu)檎嚓P(guān),說明有正向的影響, 社會投資從正相關(guān)逐漸變成負相關(guān),說明有負向的影響,進出口總額從負相關(guān)逐漸變成正相關(guān),說明有正向的影響。
參考文獻
[1]劉麗華,劉堯. 基于回歸分析的人均GDP 影響因素研究[J] .經(jīng)濟研究導刊. 2013 ( 7) .
[2]沈冰. 基于面板數(shù)據(jù)的分位數(shù)回歸分析——浙江省GDP的影響因素[J]. 財經(jīng)縱覽_財政金融 (2015年10期).
[3]李育安. 分位數(shù)回歸及應(yīng)用簡介[J]. 統(tǒng)計與信息論壇 第21卷第3期 (006年5月).
[4]Koenker, Bassett. Regression Quantiles[J]. Econometrica, 1978, (46).
[5]Bassett , Koenker. Strong Consistency of Regression Quantiles and?? Related Empirical Processes[J]. Econometric Theory , 1986, (2).
[6]Powell , James L. Censored Regression Quantiles[J].Journal of Econo-metrics, 1986, (32).
[7]Hong H , Chernozhukov V. Three-Step Censored Quantile Regression and Extramarital Affairs[J ] . Journal of the American Statistical Asso-ciation, 2002, (97).
[8]李群峰.? 基于分位數(shù)回歸的面板數(shù)據(jù)模型估計方法[J]. 統(tǒng)計與決策. 2011(17)
[9]黃蓓、范悍彪,宋峰. 中國地區(qū)經(jīng)濟增長收斂性分位數(shù)回歸分析[J]. 安徽財經(jīng)大學
[10]姜成飛. 分位數(shù)回歸方法綜述[J]. 科技信息(2013年25期)

最受歡迎的見解
1.R語言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語言泊松Poisson回歸模型分析案例
5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗
6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現(xiàn)
7.在R語言中實現(xiàn)Logistic邏輯回歸
8.python用線性回歸預測股票價格
9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標