第十章 工具變量法
10.5 使用數(shù)據(jù)集acemoglu.dta復(fù)制Acemoglu et al.(2001)的部分結(jié)果。該數(shù)據(jù)集包含64個曾為歐洲殖民地的國家,主要變量為logpgp95(1995年人均GDP,購買力平價),avexpr(1985~1995年間的平均產(chǎn)權(quán)保護(hù)程度,0為最低,10為最高),lat_abst(首都緯度的絕對值除以90),以及l(fā)ogem4(殖民者死亡率的對數(shù))。另外,變量shortnam以三個字母作為每個國家的筒稱。
(1)散點圖如下所示。


(2)回歸結(jié)果如下所示。

從統(tǒng)計意義上看,在5%的顯著性水平下,方程整體以及兩個解釋變量的回歸系數(shù)均顯著;
從經(jīng)濟(jì)意義上看:
①avexpr的回歸系數(shù)說明,在其他條件不變的情況下,1985~1995十年間平均產(chǎn)權(quán)保護(hù)程度每上升1個等級,1995年按購買力平價的人均GDP就會平均提高0.47%,比較合理;
②注意到lat_abst的取值是緯度的絕對值除以90,取值在[0,1]之內(nèi),解釋含義時需要考慮單位。lat_abst的回歸系數(shù)說明,在其他條件不變的情況下,首都處于位置的維度絕對值每增加1度會使GDP平均提高(1.577/90)%=0.0175%,從量綱上看比較合理。
(3)使用穩(wěn)健標(biāo)準(zhǔn)誤進(jìn)行2SLS回歸,并顯示第一階段回歸結(jié)果。


使用工具變量法進(jìn)行回歸后,雖然回歸方程仍顯著,但R2下降為10.25%,說明模型的解釋能力下降了;并且解釋變量lat_abst不再顯著,認(rèn)為國家首都的地理位置對經(jīng)濟(jì)發(fā)展的影響不大;avexpr的回歸系數(shù)說明,在其他條件不變的情況下,1985~1995十年間平均產(chǎn)權(quán)保護(hù)程度每上升1個等級,會使1995年按購買力平價的人均GDP平均提高約1%,仍然是比較合理的范圍。
(4)F統(tǒng)計量超過10,因此通過經(jīng)驗判斷l(xiāng)ogem4不是弱工具變量。

10.6 生育行為如何影響勞動力供給?具體來說,如果婦女多生一位小孩,其勞動力供給將下降多少?本題使用來自美國1980年人口普查的數(shù)據(jù)集fertility_small.dta進(jìn)行估計。此數(shù)據(jù)集包含美國21~35歲已婚且有兩個或更多子女的婦女信息,主要變量為weeks(1979年的工作周數(shù)),morekids(是否有兩個以上小孩),以及samesex(頭兩個小孩是否性別相同)。
(1)回歸結(jié)果如下。方程線性關(guān)系和morekids解釋變量均非常顯著,因此可以認(rèn)為有兩個以上孩子的婦女在1979年的工作周數(shù)比只有兩個孩子的婦女平均少6周。但需要注意的是解釋變量過少,導(dǎo)致R2才不到0.02,所以模型的解釋能力很差。

(2)不能,可能存在雙向因果。從經(jīng)濟(jì)含義的角度分析,一方面,子女?dāng)?shù)量增加會導(dǎo)致婦女工作時間的減少;另一方面,工作時間的減少會導(dǎo)致婦女有時間或者動機(jī)去養(yǎng)育更多的子女。因此模型可能存在聯(lián)立方程偏差,考慮使用工具變量法處理。
(3)回歸系數(shù)不到0.07,顯著但效應(yīng)不大。

(4)判斷samesex是否可以作為工具變量,主要驗證以下兩個問題:
①相關(guān)性:工具變量和內(nèi)生解釋變量相關(guān);
②外生性:工具變量與擾動項不相關(guān)。
首先,通過上一問可知,雖然效應(yīng)不強(qiáng),但工具變量和內(nèi)生解釋變量之間的相關(guān)性仍是(統(tǒng)計上)顯著的。
其次,判斷工具變量的外生性。由于只有一個內(nèi)生解釋變量morekids,一個工具變量samesex,所以最多是恰好識別,不可能是過度識別,因此無法使用過度識別檢測來判斷有無外生性,只能通過“排他性約束/定性討論”方法解決。一方面,頭兩個孩子的性別會影響母親后續(xù)的生育決策,進(jìn)而影響其工作時長;另一方面,頭兩個孩子的性別對母親的工作時長沒有直接影響,因此可以認(rèn)為滿足外生性的假設(shè)。
綜上所述,可以使用samesex作為工具變量。
(5)F=143.15遠(yuǎn)遠(yuǎn)大于10,認(rèn)為samesex不是弱工具變量。


(6)回歸結(jié)果如下。效應(yīng)與一元線性回歸時差別不大,但在10%顯著性水平下不再顯著。

(7*)先使用工具變量回歸。


方程整體顯著,但morekids和hispan在10%顯著性水平下不顯著。再看使用全部解釋變量直接進(jìn)行OLS回歸的情況。

使用esttab命令對比兩次回歸的結(jié)果,morekids在OLS以1%顯著,在2SLS不顯著。


但morekids正是我們關(guān)心的解釋變量,它不顯著這個模型就沒意義了。嘗試使用Hausman test和DWH test檢驗納入所有變量后的方程是否還存在內(nèi)生解釋變量的問題,如果不存在話我們傾向于使用OLS模型。



結(jié)果均不顯著,認(rèn)為不再存在內(nèi)生性,使用工具變量法的大前提不存在了,所以采用OLS回歸的方程即可。
個人認(rèn)為原因在于,內(nèi)生性的來源主要有遺漏變量偏差、聯(lián)立方程偏差(雙向因果關(guān)系)、測量誤差偏差3個方面。原模型(只有morekids解釋變量)內(nèi)生性主要來自于遺漏變量偏差,而非(2)問中回答的雙向因果關(guān)系,因此在本小問中,將OLS模型中的samesex、age、black等解釋變量補(bǔ)充完全以后,遺漏變量偏差和內(nèi)生性顯著減小,故沒有使用工具變量法的必要了。
總結(jié):工具變量法的使用步驟
①選取足夠的解釋變量進(jìn)行OLS回歸,避免產(chǎn)生遺漏解釋變量偏差;
②判斷哪個解釋變量是內(nèi)生的,并結(jié)合經(jīng)濟(jì)意義引入滿足條件的工具變量;
③使用2SLS進(jìn)行回歸,不滿足球形擾動則使用穩(wěn)健標(biāo)準(zhǔn)誤;
④通過2SLS第一階段回歸結(jié)果中的回歸系數(shù)p值判斷iv是否滿足相關(guān)性。(這一步也可以跳過,若⑥中檢驗不是弱工具變量,那么一定滿足相關(guān)性,因為強(qiáng)>弱>無關(guān))
⑤判斷iv是否滿足外生性:
1)若方程為過度識別,則使用過度識別檢驗;
2)若方程為恰好識別,則使用排他性約束定性討論。
⑥在不使用穩(wěn)健標(biāo)準(zhǔn)誤的2SLS下,利用經(jīng)驗規(guī)則判斷是否為弱解釋變量,如果是:
1)回到步驟②重新找iv;
2)放棄2SLS,并使用LIML方法。
⑦使用Hausman test或DWH test檢驗是否存在內(nèi)生解釋變量。這是工具變量法的大前提,從邏輯上講應(yīng)該首先進(jìn)行,之所以放到后面是因為這兩個檢驗是基于2SLS方程的,如果iv是無效的,那么2SLS方程也就沒意義了。
⑧匯報結(jié)果,視經(jīng)濟(jì)意義選擇最合適的方程。
更正:原來的10.5題有錯誤。
雙對數(shù)模型(單對數(shù)同理) lny=a+blnx?的經(jīng)濟(jì)含義是“x每增加1%,則y平均增加b%”,而不是“y平均增加100*b%(b的百分?jǐn)?shù)形式)”,即解釋經(jīng)濟(jì)含義時要b%才能反映y的變動情況。
僅供參考,有錯誤請在評論區(qū)反饋。