雙重差分法原理及其應(yīng)用
在計(jì)量經(jīng)濟(jì)學(xué)研究中,雙重差分法(Difference-in-Difference,DID)多用于公共政策或項(xiàng)目實(shí)施效果評估。近年來,雙重差分法受到越來越多研究人員的青睞;本文將從雙重差分法的原理、假設(shè)、模型說明以及案例講解四方面進(jìn)行介紹:
(一)原理
雙重差分法普遍應(yīng)用于政策效應(yīng)評估研究。
例如研究 “ 京津冀協(xié)同發(fā)展 ” 、“ 高鐵開通 ” 等政策實(shí)施帶來的影響情況。
基本思想:
我們一般將使得自然環(huán)境發(fā)生改變的實(shí)驗(yàn)叫做自然實(shí)驗(yàn)。
雙重差分法是一種比較成熟的進(jìn)行政策研究的分析方法,其作用原理與自然實(shí)驗(yàn)相類似。它將某項(xiàng)政策的實(shí)施看作是一項(xiàng)自然實(shí)驗(yàn),通過在樣本中加入一組未受政策影響控制組,與原本受政策影響的樣本點(diǎn)構(gòu)成實(shí)驗(yàn)組進(jìn)行比較分析,來考察政策實(shí)施對分析對象造成的凈影響。
(二)假設(shè)
使用雙重差分法進(jìn)行政策效應(yīng)評估,樣本數(shù)據(jù)需要滿足三個(gè)假設(shè),分別是線性關(guān)系假設(shè)、個(gè)體處理穩(wěn)定性假設(shè)、平行趨勢假設(shè)。前兩個(gè)假設(shè)一般都會(huì)滿足,不需要單獨(dú)進(jìn)行驗(yàn)證,應(yīng)該重點(diǎn)驗(yàn)證假設(shè)3。
假設(shè)1——線性關(guān)系假設(shè)
潛在結(jié)果變量同處理變量和時(shí)間變量滿足線性條件。
假設(shè)2——個(gè)體處理穩(wěn)定性假設(shè)
政策干預(yù)只影響實(shí)驗(yàn)組,不會(huì)對控制組產(chǎn)生交互影響。
假設(shè)3——平行趨勢假設(shè)(最重要)
實(shí)驗(yàn)組和控制組在沒有政策干預(yù)之前,二者的結(jié)果效應(yīng)趨勢應(yīng)該是一樣的(滿足平行趨勢)。
SPSSAU進(jìn)行平行趨勢檢驗(yàn)的方法主要可分為以下幾種:
以上檢驗(yàn)方法將在下述案例講解中進(jìn)行演示說明。
(三)模型說明
雙重差分法模型如下:
其中,i 代表個(gè)體,t 代表時(shí)間。Treat i 是分組虛擬變量,如果個(gè)體 i 屬于實(shí)驗(yàn)組, 則Treat i =1;否則Treat i =0 。 After t 是分期虛擬變量,時(shí)間 t 在政策事件發(fā)生后,則 After t =1;否則 After t = 0;Treat i *After t為交互項(xiàng),其系數(shù)β3即為雙重差分模型重點(diǎn)考察的政策實(shí)施的凈效應(yīng)。
模型系數(shù)含義:
原理示意圖:
(四)案例講解
1、背景說明
研究經(jīng)濟(jì)示范區(qū)的設(shè)立是否會(huì)對地區(qū)經(jīng)濟(jì)增長產(chǎn)生影響(數(shù)據(jù)虛構(gòu),無實(shí)際意義)。
實(shí)驗(yàn)組為設(shè)立為高新區(qū)的B地區(qū),控制組為與B地區(qū)除是否設(shè)立高新區(qū)這一因素外,其余發(fā)展條件相似的A地區(qū)。數(shù)字0為政策實(shí)施前,數(shù)字1為政策實(shí)施后。研究的效應(yīng)項(xiàng)即被解釋變量Y為 “ GDP ”,除此之外,還有3個(gè)控制變量(如:人口、對外投資、高校數(shù)量等會(huì)影響GDP的指標(biāo))。
2、數(shù)據(jù)格式
雙重差分法的數(shù)據(jù)格式如下圖所示,地區(qū)1表示實(shí)驗(yàn)組,地區(qū)0表示控制組;時(shí)間1表示政策實(shí)施后,時(shí)間0表示政策實(shí)施前。
3、SPSSAU操作
使用SPSSAU進(jìn)行雙重差分法操作如下,將指標(biāo)分別拖拽到左側(cè)對應(yīng)分析框中:
4、輸出結(jié)果解讀
雙重差分法得到的分析結(jié)果,需要重點(diǎn)關(guān)注的表格包括DID模型描述統(tǒng)計(jì)表、DID模型結(jié)果匯總表、t檢驗(yàn)(Before)表、OLS回歸分析結(jié)果表,分別說明如下:
- DID模型描述統(tǒng)計(jì)
上表格展示實(shí)驗(yàn)組、控制組,以及實(shí)驗(yàn)前后的樣本分布情況。從上表可知,本案例實(shí)驗(yàn)組共有155個(gè)樣本,控制組共有646個(gè)樣本。雙重差分法共4種組合,即實(shí)驗(yàn)組實(shí)驗(yàn)前、實(shí)驗(yàn)組實(shí)驗(yàn)后、控制組實(shí)驗(yàn)前、控制組實(shí)驗(yàn)后,每種組合一定要有數(shù)據(jù)才可以。
DID模型結(jié)果匯總
上表格展示DID模型最終結(jié)果。分別包括實(shí)驗(yàn)前(Before)和實(shí)驗(yàn)后(After)時(shí),控制組或?qū)嶒?yàn)組的效應(yīng)值水平。
效應(yīng)值:效應(yīng)值是一種量化指標(biāo),并非被解釋變量從業(yè)人數(shù)的平均值(但通常接近于平均值),數(shù)學(xué)原理上其為ols回歸的回歸系數(shù)值。
表格解讀:
①實(shí)驗(yàn)前Before狀態(tài)時(shí),實(shí)驗(yàn)組和控制組的差分效應(yīng)量對應(yīng)的t檢驗(yàn)的p=0.556>0.05,沒有呈現(xiàn)出顯著性差異,即說明實(shí)驗(yàn)前,實(shí)驗(yàn)組和控制組的效應(yīng)水平結(jié)果沒有明顯的差異性,即說明樣本滿足 ‘平行趨勢假設(shè) ’。
②實(shí)驗(yàn)后After狀態(tài)時(shí),實(shí)驗(yàn)組和控制組的差分效應(yīng)量對應(yīng)t檢驗(yàn)的p=0.024<0.05,呈現(xiàn)出顯著性差異,即說明在實(shí)驗(yàn)后,實(shí)驗(yàn)組的效應(yīng)值明顯高于控制組效應(yīng)值。
③Diff-in-Diff,即最終的雙重差分值,上表格時(shí),雙重差分效應(yīng)值為2.935且對應(yīng)t檢驗(yàn)的p=0.045<0.05,呈現(xiàn)出顯著性差異,即說明雙重差分效應(yīng)顯著,說明 “ 高新區(qū)的設(shè)立 ” 有助于 “ 地區(qū)經(jīng)濟(jì)增長 ”,提高的平均效應(yīng)水平為2.935。
t檢驗(yàn)(Before)(平行趨勢檢驗(yàn))
上表格展示t檢驗(yàn)法進(jìn)行“ 平行趨勢檢驗(yàn) ”:針對實(shí)驗(yàn)前數(shù)據(jù)進(jìn)行t檢驗(yàn),可以看出,實(shí)驗(yàn)組和控制組并沒有呈現(xiàn)出顯著性差異(p=0.978>0.05),說明在實(shí)驗(yàn)前,實(shí)驗(yàn)組和控制組的GDP并沒有明顯的差異性,即樣本滿足平行趨勢假設(shè)(通常僅關(guān)注被解釋變量Y的差異性)。
補(bǔ)充:平行趨勢檢驗(yàn)的其他方法
交互項(xiàng)顯著性檢驗(yàn)法
① 將時(shí)間項(xiàng)做啞變量處理 【生成變量->虛擬(啞)變量】
② 將時(shí)間_實(shí)驗(yàn)前與地區(qū)作交互項(xiàng)得到Product_2項(xiàng) 【生成變量->乘積(交互項(xiàng))】
③ 交互項(xiàng)與被解釋變量Y做線性回歸,判斷交互項(xiàng)顯著性。
從上表可以看出,交互項(xiàng)Product_2項(xiàng)對應(yīng)p=0.957>0.05,沒有呈現(xiàn)出顯著性,說明樣本數(shù)據(jù)滿足平行趨勢假設(shè)。?
F檢驗(yàn)法
與交互項(xiàng)顯著性檢驗(yàn)法檢驗(yàn)過程一樣,最后查看F統(tǒng)計(jì)量顯著性。
從上表可以看出,F(xiàn)統(tǒng)計(jì)量對應(yīng)p=0.957>0.1(一般以p>0.1作為標(biāo)準(zhǔn)),沒有呈現(xiàn)出顯著性,說明樣本數(shù)據(jù)滿足平行趨勢假設(shè)。
圖示法
使用SPSSAU簇狀圖完成,橫坐標(biāo)為時(shí)間,縱坐標(biāo)為被解釋變量Y:
從上圖可以看出,實(shí)驗(yàn)前實(shí)驗(yàn)組和控制組的GDP效應(yīng)水平基本一致,因此樣本數(shù)據(jù)滿足平行趨勢假設(shè)。
OLS回歸分析結(jié)果
上表格展示OLS回歸分析結(jié)果,其為雙重差分模型的數(shù)學(xué)原理。
如上表格中 “ 地區(qū)*時(shí)間 ” 這一交互項(xiàng)的回歸系數(shù)值2.935即為 “ DID模型結(jié)果匯總 ”表格中的Diff-in-Diff效應(yīng)值。
其他說明
雙重差分法的模型和原理相比其他方法來講比較容易理解和運(yùn)用,同時(shí)其能夠很大程度地避免內(nèi)生性問題,即有效控制被解釋變量和解釋變量之間的相互影響效應(yīng),這兩點(diǎn)主要原因使得雙重差分法近年來被廣泛應(yīng)用。
但是雙重差分法也有其局限性。比如雙重差分法主要適用于面板數(shù)據(jù),如果只是截面數(shù)據(jù),就不適合使用該方法;再者在實(shí)際研究中,很可能找不到合適的控制組來進(jìn)行比較,那么研究者很可能根據(jù)主觀判斷選取控制組,導(dǎo)致研究不夠嚴(yán)謹(jǐn)。所以在實(shí)際研究中,一定要關(guān)注雙重差分法使用的前提假設(shè)等。如果確實(shí)不適合使用雙重差分法,可以選擇其他方法進(jìn)行分析,比如PSM-DID、合成控制法等等。
案例數(shù)據(jù)請查看幫助手冊:https://spssau.com/helps/conometricstudy/did.html