互助問答第7期
問:想請問下,數(shù)據(jù)的控制變量不顯著的話,用什么辦法能調(diào)整呢?自變量因變量顯著,R方很低,0.1,我用的是混合OLS,應(yīng)該是面板數(shù)據(jù),是不同公司在不同年份的業(yè)績表現(xiàn)的數(shù)據(jù)。使用的公式是reg robust,用XTSET YEAR?顯示數(shù)據(jù)是非平衡面板,也用不了豪斯曼檢驗。
答:模型中控制變量如果比較多,可能是因為共線性,其中包括控制變量與控制變量之間的共線性、控制變量與自變量之間的相關(guān)性。建模者需要選用逐步回歸篩選一下。不顯著是因為t值較小,即t=b/s,s標(biāo)準(zhǔn)差較大,OLS估計的性質(zhì)中的有效性差,即方差大,標(biāo)準(zhǔn)誤差大。當(dāng)然,原因不僅僅局限于共線性,自相關(guān)與異方差的存在都會使有效性得不到滿足(方差不是最小的)。因此,只要克服了經(jīng)典OLS回歸中的基本假設(shè)不滿足狀況,就可以提高控制變量顯著性。具體可使用廣義差分法、廣義最小二乘法(GLS)等方法來克服相關(guān)性;使用加強(qiáng)最小二乘法(WLS)、GLS等方法來克服異方差;使用逐步回歸來克服共線性。
問:(1)李春濤老師帶領(lǐng)的爬蟲俱樂部編寫了chinagcode命令,可以根據(jù)中文地址得到經(jīng)緯度,這一經(jīng)緯度返回的是百度坐標(biāo)系(BD-09)下得到的經(jīng)緯度,想請問一下這一經(jīng)緯度如何在stata中轉(zhuǎn)變?yōu)槭澜鐦?biāo)準(zhǔn)經(jīng)緯度坐標(biāo)系(WGS-84)下的經(jīng)緯度?備注:我在網(wǎng)上找到了Python、R或者ArcGIS對應(yīng)的code或package可以完成坐標(biāo)轉(zhuǎn)換,但是因為不想跨平臺分析數(shù)據(jù),所以想請問可否在stata中直接完成轉(zhuǎn)換。
(2)stata中是否有做非線性兩階段最小二乘法(NL2SLS)的回歸命令?R也可以。備注:stata中有非線性回歸的nl命令,也有做2sls的ivregress的命令,有沒有結(jié)合兩者用GMM方法來估計nonlinear 2sls參數(shù)的命令?
答:(1)方法有兩種:如果使用百度地圖,則需要通過ArcGIS或Python轉(zhuǎn),然后提取經(jīng)緯度,再將其轉(zhuǎn)換保存為stata格式,可參考https://www.jianshu.com/p/6e69737cffaa;第二,使用英文地址、并ssc install geocode,將Google Maps和Stata聯(lián)合起來,通過geocode將地理位置轉(zhuǎn)化為相應(yīng)的經(jīng)緯度??蓞⒖枷嚓P(guān)內(nèi)容:geocode 獲取經(jīng)緯度(http://blog.sina.com.cn/s/blog_629bb7580 1012how.html);中文地址如何提取經(jīng)緯度?http://blog.sina.cn/dpool/blog/s/blog_624078b50102wf20.html?from=group message
(2)目前stata軟件沒有將兩者結(jié)合在一起的官方文件包,也沒有誰開發(fā)百度地圖直接轉(zhuǎn)的stata代碼或程序包。另外,WGS-84是橢球,不是平面,使用stata做這個的目的是什么?畫規(guī)范地圖推薦ArcGIS,做數(shù)據(jù)跑回歸推薦stata。
問:老師,您好!在stata中判斷數(shù)值是否符合正態(tài)分布,峰度和偏度最好是不超過多少,百度百科上說正太分布峰度為3,偏度為0,那如果偏離這兩個數(shù),會不會對結(jié)果有很大影響。請老師幫我判斷下面的偏度和峰度值對回歸結(jié)果會有很大影響嗎?
問:回歸結(jié)果中系數(shù)的顯著性主要是是根據(jù)z統(tǒng)計量或t統(tǒng)計量來判斷得。每個系數(shù)服從不同的正態(tài)分布,不便比較,所以都轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布再檢驗,此時是z統(tǒng)計量判斷。如果是小樣本,再轉(zhuǎn)換為t分布,根據(jù)t統(tǒng)計量判斷。數(shù)據(jù)的分布是基于正態(tài)分布假設(shè)的。在不滿足的正態(tài)分布的情況還有截斷正態(tài)分布等。

