第九章 模型設(shè)定與數(shù)據(jù)問題
9.1、9.2是練習題,9.3~9.5是Stata編程題。本章有一些問題不確定,在題號前用*標注出來了,如果有疑問請在評論區(qū)提出,感謝。
9.1*?…在使用樣本數(shù)據(jù)估計回歸方程y=α+βx+ε時,如果懷疑x對y的作用還依賴于另一變量z,應該如何檢驗此依賴性?
原方程回歸方程:y=α+βx+ε;
參考RESET檢驗的思想,構(gòu)造輔助回歸:y=α+βx+θx*z + ε,并檢驗H0:θ=0;
若結(jié)果不顯著,認為x對y的作用不依賴于z;
若結(jié)果顯著,認為x對y的作用依賴于z。
9.2 …在lnQ的樣本均值處,應該如何檢驗成本的產(chǎn)出彈性(elasticity ofcost with respect to output)為1的原假設(shè)?
原方程
其中C=C(Q),雙側(cè)對Q求導:
由彈性定義可知:
對求導后的方程左右同時乘以Q得:
對于任意給定的樣本Q,lnQ的均值為一常數(shù)(記作k),從而僅需驗證:
構(gòu)造似然比檢驗的F統(tǒng)計量:
其中線性約束個數(shù)m=1,變量個數(shù)K=3(、、常數(shù)項),樣本數(shù)n,SSR為
的殘差平方和,SSR*為
的殘差平方和。通過比較F統(tǒng)計量和其臨界值,判斷是否成立。
9.3 使用數(shù)據(jù)集nerlove.dta ,估計以下模型…
(1)回歸結(jié)果如下。

(2)方差膨脹因子VIF選小于10,認為不存在多重共線性。

(3)利用擬合值(default)和解釋變量(rhs)進行RESET檢驗,結(jié)果均顯著,均認為遺漏了高階非線性項。

(4)回歸結(jié)果如下。

(5*)再次利用擬合值和解釋變量(rhs)進行RESET檢驗。擬合值的檢驗結(jié)果不再顯著;但解釋變量的檢驗結(jié)果依然顯著。
(使用擬合值和解釋變量進行RESET檢驗的兩種方法有何差別?應當如何解釋?)

(6)存在顯著的多重共線性。

(7*)個人認為兩個結(jié)果都不是很合理。前者存在遺漏非線性項的問題,而后者存在多重共線性。考慮解決后者的多重共線性問題。首先對lnq進行標準化得標準化變量lnqd,進一步得到其平方項lnqd2,重新進行回歸。

此時可以看出lnqd和lnqd2的回顧系數(shù)都非常顯著,原回歸方程中只有l(wèi)nqd顯著。再次求VIF,發(fā)現(xiàn)多重共線性問題得以解決。

因此可以認為這個模型同時解決了多重共線性和遺漏非線性項問題,優(yōu)于前面兩個模型。
9.4 使用數(shù)據(jù)集Growth.dta考察貿(mào)易與增長的關(guān)系。該數(shù)據(jù)集的被解釋變量65個國家1960-1995年的平均增長率(growth),而主要解釋變量為1960-1995年的平均貿(mào)易開放度(tradeshare)。
(1)從散點圖上看具有一定的線性關(guān)系,但不是非常明顯。

(2)先按照growth降序排列,Malta的坐標為(1.99,6.65),在上面的散點圖中已經(jīng)標注出來。直觀上看,Malta雖然距離回歸方程不遠,但它的貿(mào)易開放度很高,偏離tradeshare均值過多,考慮是極端數(shù)據(jù)。

或者直接使用list命令篩選

(3)回歸結(jié)果如下,斜率和截距項的估計值分別為2.31和0.64。

(4)分別計算lev后,可得lev均值為0.03。將lev降序排序,并輸出前10位,可以發(fā)現(xiàn)第2~10個國家超過lev均值并不多,而第一位的Malta的lev值超過均值13倍,可以確定屬于極端值。


(5)使用drop命令剔除Malta,提示一個觀測值已刪除,再次進行回歸。


雖然剔除極端數(shù)據(jù)后,方程在5%顯著性水平下不顯著了,但是考慮到一方面,還存在其他解釋變量,僅使用一個解釋變量回歸不顯著說明不了問題;另一方面,重新繪制的散點圖和線性擬合圖變的更合理了。

(6)查找資料:
馬耳他,是位于南歐、地中海中心的迷你島國,近鄰意大利和突尼斯,國土面積316km2。由位于地中海中心的群島組成,總?cè)丝诩s48萬,有著”騎士之國“的美譽。作為地中海心臟,馬耳他是理想的物流樞紐,天然良港便于貨物進出口,基礎(chǔ)設(shè)施完善,便于高端制造業(yè)和投資行業(yè)聚集。除此之外,馬耳他四位一體的身份也讓其吸引了一大批投資者。
馬耳他是歐盟成員國、申根成員國、歐元區(qū)國家和英聯(lián)邦成員國,四重身份加持,讓工作、生活、求學、經(jīng)商變得無往不利。而且馬耳他是非全球征稅國家,對本國非稅務(wù)居民,馬耳他政府僅就該居民在馬耳他產(chǎn)生的收入征收個稅。大多數(shù)情況下,投資人仍將被視為非稅務(wù)居民。馬耳他無不動產(chǎn)稅、無凈財富稅、無遺產(chǎn)稅與贈予稅。在馬耳他運營的公司還可以享受馬耳他稅收福利以及歐盟關(guān)稅補貼等。
綜上,馬耳他人口和國土規(guī)模小,地理位置和政策特殊,不具有代表性,應該剔除。
(7)回歸結(jié)果如下。

①回歸方程整體在1%的顯著性水平下顯著,但R2不到30%,模型的解釋能力比較差;
②以***、**、*分別表示在1%、5%、10%的水平上顯著,則:
tradeshare,assassinations,rev_coups*,rgdp60***,yearsschool***;
③經(jīng)濟意義不解釋了,沒有單位。
(8*)個人認為,rgdp60和yearsschool是控制變量,僅需關(guān)注基期時的差異,而不需要關(guān)注二者在時期內(nèi)的變化;而tradeshare,assassinations和rev_coups*是解釋變量,所以需要考察時期內(nèi)的變化(取平均值)。
9.5?美國的汽油需求函數(shù)是否穩(wěn)定?使用數(shù)據(jù)集gasoline.dta,估計美國1953—2004年的汽油需求函數(shù)…
(1)使用以下兩種等價命令繪制將lgasp和lgasq的時間趨勢圖畫在一起。這樣看lgasq基本沒有結(jié)構(gòu)變化。


但是注意到兩個數(shù)據(jù)正負相反,畫在一起會壓縮Y軸導致變動不明顯。下面單獨考察lgasq的時間趨勢圖,發(fā)現(xiàn)在1975年左右,前后的斜率出現(xiàn)了比較明顯的變化,因此石油需求函數(shù)是可能存在結(jié)構(gòu)變動的,需要進一步檢驗。


(2)回歸結(jié)果如下所示。

(3)分別使用擬合值和擬合變量進行BP檢驗均不顯著,認為不存在異方差。

但是在5%的顯著性水平下未通過懷特檢驗,結(jié)合兩種檢驗的結(jié)果,認為可能是擾動項條件方差與解釋變量存在非線性相關(guān),因此存在異方差。

(4)一階二階的BG檢驗、Davidson-MacKinnon改進的BG檢驗結(jié)果均不顯著,認為不存在自相關(guān)。


兩種Q檢驗方法同樣均不顯著。綜上認為不存在自相關(guān),這和習題8.3的結(jié)論是相同的。


(5*)通過(3)、(4)兩問可以認為該模型存在異方差,不存在自相關(guān),因此傳統(tǒng)的鄒檢驗不成立,需使用虛擬變量法檢驗是否存在結(jié)構(gòu)變動,根據(jù)原理構(gòu)造輔助回歸
并檢驗
其中虛擬變量
下面使用Stata實現(xiàn)
首先構(gòu)造虛擬變量和各互動項,并進行回歸。注意到存在異方差,應當使用穩(wěn)健標準誤:


然后聯(lián)合檢驗d和各互動項回歸系數(shù)是否顯著,即H0是否成立:

F統(tǒng)計量P值接近于0,強烈拒絕原假設(shè),認為存在1974年以后存在結(jié)構(gòu)變動。至此本題已經(jīng)完成了。
個人的兩個問題:
①驗證存在結(jié)構(gòu)變動后,是否應該分1974年前后兩個子樣本回歸得lgasq的分段函數(shù)?
②如果在子樣本的回歸方程中,各自均有解釋變量不顯著,且剔除后對方程線性關(guān)系影響不大,是否可以剔除?這種操作會使兩方程的回歸系數(shù)和解釋變量的構(gòu)成均發(fā)生變化,是否還屬于“結(jié)構(gòu)變動”的范疇?
具體來說,兩個子樣本回歸:


以后者為例,剔除不顯著的解釋變量lpuc和lpnc后,R2仍然在96%以上,說明解釋能力沒有下降,F(xiàn)統(tǒng)計量值反而上升了,其他回歸系數(shù)依然顯著,看起來沒什么問題。但lpnc在前者中是顯著的,所以不能剔除,這樣兩個方程中解釋變量的構(gòu)成就產(chǎn)生了差異。

僅供參考,有錯誤請在評論區(qū)反饋。?