斷點(diǎn)回歸方法 (RDD) 全網(wǎng)最全操作指南,保姆級(jí)教學(xué)

1. 因果推斷,恰逢其時(shí)
2. 斷點(diǎn)回歸 (RDD),上帝之手
3. 斷點(diǎn)回歸基本步驟,明晰操作
3.1 精確斷點(diǎn) (SRD) 還是模糊斷點(diǎn) (FRD)
3.2 有效性檢驗(yàn) (主要是3個(gè)方面)
3.3 參數(shù)還是非 (半) 參數(shù)估計(jì)
3.4 帶寬的敏感性測(cè)試
3.5 安慰劑檢驗(yàn)
3.6 樣本選擇的敏感性檢驗(yàn)
3.7 其他的穩(wěn)健性檢驗(yàn)
4. 斷點(diǎn)回歸 Stata 操作,立刻上手
5. 斷點(diǎn)回歸經(jīng)典案例,尋找思路
5.1 稅收分成 ?(稅收征管) 改革
5.2 退休制度
5.3 地理斷點(diǎn) (空氣污染等)
5.4 轉(zhuǎn)移支付 (國(guó)家級(jí)貧困縣人均收入為界)
5.5 義務(wù)教育法 (9年義務(wù)教育)
5.6 股權(quán)結(jié)構(gòu) (50%持股權(quán))
5.7 其他請(qǐng)查閱相關(guān)綜述文章。
6. 斷點(diǎn)回歸視頻推薦,繼續(xù)鞏固
7. 斷點(diǎn)回歸資料合集,重在積累
8. 結(jié)語(yǔ)
陸陸續(xù)續(xù)搞了幾天,終成此文。收集寫(xiě)作此文的目的是希望全面的梳理斷點(diǎn)回歸相關(guān)的操作,以幫助大家更好更快入手,減少不必要的時(shí)間成本和搜尋成本。當(dāng)然,限于個(gè)人能力,文中難免有不當(dāng)之處,懇請(qǐng)大家批評(píng)指正。
1. 因果推斷,恰逢其時(shí)
因果推斷 (casual inference) 是社會(huì)科學(xué)研究的核心,社會(huì)科學(xué)研究的一個(gè)最主要的目的在于通過(guò)已有的實(shí)證信息進(jìn)行因果關(guān)系的推論,以此解釋經(jīng)濟(jì)社會(huì)現(xiàn)象背后的規(guī)律,或者評(píng)估特定事件沖擊及經(jīng)濟(jì)社會(huì)政策帶來(lái)的影響。但從復(fù)雜的現(xiàn)實(shí)世界中獲得真實(shí)的因果推斷往往十分困難。研究者面臨的一個(gè)重要挑戰(zhàn)便在于通過(guò)適當(dāng)?shù)难芯吭O(shè)計(jì)克服困難,獲得其所希望探討的因果關(guān)系的可信推斷。
對(duì)于因果推斷最為可信和有影響力的研究設(shè)計(jì)當(dāng)屬隨機(jī)分配 (randomized assignment),而對(duì)這一設(shè)計(jì)最常應(yīng)用的場(chǎng)景是實(shí)驗(yàn)室實(shí)驗(yàn) (laboratory experiment),其通過(guò)隨機(jī)的分配處理組 (treatment group) 和控制組 (control group) 來(lái)排除其他干擾因素的影響。
但由于成本過(guò)高或者倫理約束,社會(huì)科學(xué)研究者往往無(wú)法進(jìn)行隨機(jī)實(shí)驗(yàn),取而代之的是利用不同的研究設(shè)計(jì)和方法獲得近似于隨機(jī)實(shí)驗(yàn)的效果。即尋找自然狀態(tài)下產(chǎn)生的近似于隨機(jī)實(shí)驗(yàn)的自然實(shí)驗(yàn) (natural experiment) ,或以創(chuàng)新的方式對(duì)研究對(duì)象進(jìn)行“控制”的田野實(shí)驗(yàn)(field experiment) 。
基于實(shí)驗(yàn)路徑的研究能夠在一定程度上克服這一缺陷,因而在社會(huì)科學(xué)、尤其是經(jīng)濟(jì)學(xué)領(lǐng)域受到了學(xué)者們?cè)絹?lái)越多的重視。
因此,基于反事實(shí)的準(zhǔn)實(shí)驗(yàn) (Quasi-experimental) 方法在社會(huì)科學(xué)研究中越來(lái)越受到重視 (Gangl,2010;Morgan and Winship,2015),工具變量法 (Instrumental Variable,IV)、雙重差分(Difference-in-Difference,DID)、斷點(diǎn)回歸設(shè)計(jì) (Regression Discontinuity Design,RDD) 等因果識(shí)別方法 (Angrist and Pischke,2010) 在實(shí)證研究中的應(yīng)用越來(lái)越廣泛。
2. 斷點(diǎn)回歸 (RDD),上帝之手
在眾多準(zhǔn)實(shí)驗(yàn)方法中, 斷點(diǎn)回歸設(shè)計(jì) (Regression Discontinuity Design, RDD) 是一種非常重要的因果識(shí)別方法,具有一些獨(dú)特的優(yōu)勢(shì)。
首先,斷點(diǎn)回歸設(shè)計(jì)比其他方法更接近于隨機(jī)實(shí)驗(yàn),可以得到與 RCT 類似的估計(jì)結(jié)果 (Shadish et al.,2002;Lee and Lemieux,2010;羅勝,2016;Athey and Imbens,2017;劉生龍,2021),它能夠從實(shí)驗(yàn)基準(zhǔn)中還原因果效應(yīng) (Recovering Experimental Benchmarks,Green et al.,2009;Hyytinen et al.,2018),具有更強(qiáng)的因果推斷力,能夠避免因果估計(jì)的內(nèi)生性問(wèn)題,反映變量之間真實(shí)的因果關(guān)系 (Lee,2008),**因而在進(jìn)行因果推斷和政策評(píng)估時(shí),RDD是最可信的準(zhǔn)實(shí)驗(yàn)方法之一 (Cattaneo and Titiunik,2022)**。
此外,RDD能夠在較弱的假設(shè)下識(shí)別因果效應(yīng),且假設(shè)易于被檢驗(yàn) (Cattaneo et al.,2020d;Valentim et al.,2021),還可以靈活地通過(guò)使用參數(shù)和非參數(shù)等不同估計(jì)方法、調(diào)整帶寬等方式對(duì)局部平均處理效應(yīng)進(jìn)行估計(jì)、推斷和穩(wěn)健性檢驗(yàn),從而增強(qiáng)RDD估計(jì)結(jié)果的可信度(Cattaneo et al., 2020a,2022)。
根據(jù)個(gè)體在臨界點(diǎn)兩側(cè)接受干預(yù)概率的差異,可以將斷點(diǎn)回歸分為精確斷點(diǎn)回歸 (sharp regression discontinuity,SRD) 和模糊斷點(diǎn)回歸 (fuzzy regression discontinuity,F(xiàn)RD) 兩類。前者是個(gè)體在臨界點(diǎn)附近接受干預(yù)的概率從0到1的變化,后者是個(gè)體接受干預(yù)的概率從一個(gè)概率到另一個(gè)概率的變化。
斷點(diǎn)回歸的直觀體驗(yàn):圖形展示(部分,變化很多)




3. 斷點(diǎn)回歸基本步驟,明晰操作
3.1 精確斷點(diǎn) (SRD) 還是模糊斷點(diǎn) (FRD)
開(kāi)展研究前,我們需要根據(jù)特定的場(chǎng)景判斷使用精確斷點(diǎn)還是模糊斷點(diǎn)。一般來(lái)說(shuō),精確斷點(diǎn)是特殊情況,在現(xiàn)實(shí)的研究設(shè)計(jì)中使用較少,主要還是以更具一般性的模糊斷點(diǎn)回歸為主。當(dāng)然,也并不絕對(duì),需要根據(jù)研究的問(wèn)題來(lái)進(jìn)行選擇。
3.2 有效性檢驗(yàn) (主要是3個(gè)方面)
我們?cè)谑褂脭帱c(diǎn)回歸進(jìn)行因果識(shí)別時(shí),必須滿足一系列的前提條件 (Imbens and Lemieux,2008)。如局部隨機(jī)化假設(shè)和連續(xù)性假設(shè)等。
第一,檢驗(yàn)被解釋變量在斷點(diǎn)處是否跳躍。這里的目的是要證明存在跳躍,也即被解釋變量在斷點(diǎn)前后存在明確的不同。這個(gè)其實(shí)就是文章中主要報(bào)告的那個(gè)圖。如He et al.(2020)順流而下的環(huán)境規(guī)制里面的圖。
He, Guojun, Shaoda Wang, and Bing Zhang. "Watering down environmental regulation in China."?The Quarterly Journal of Economics?135.4 (2020): 2135-2185.
第二,檢查驅(qū)動(dòng)變量或叫配置變量?(assignment variable,又叫 running variable、forcing variable)?是否被操縱。這里的驅(qū)動(dòng)變量,其實(shí)就是RD中決定是否進(jìn)入實(shí)驗(yàn)的分?jǐn)?shù) (Score),是否被操縱的意思就是,是否存在某種跳躍性的變化。也就是說(shuō)驅(qū)動(dòng)變量應(yīng)該是隨機(jī)變動(dòng)的,而不能被人為的操縱,只有這樣才能保證設(shè)定是正確的。
在實(shí)際操作中主要有三種方式來(lái)檢驗(yàn):
畫(huà)出驅(qū)動(dòng)或配置變量的分布圖
最直接的方法,是使用一定數(shù)量的箱體 (bin),畫(huà)出配置變量的歷史直方圖 (histogrm)。為了觀察出分布的總體形狀,箱體的寬度要盡量小。頻數(shù) (frequencies) 在箱體間的跳躍式變化,能就斷點(diǎn)處的跳躍是否正常給我們一些啟發(fā)。從這個(gè)角度來(lái)說(shuō),最好利用核密度估計(jì)做出一個(gè)光滑的函數(shù)曲線。如李連友等 (2022) 在稅收征管體制改革與社保基金收入文章中繪制的直方圖。

李連友,黃保聰,席鵬輝.稅收征管體制改革與社?;鹫骼U收入[J].經(jīng)濟(jì)學(xué)動(dòng)態(tài),2022(06):80-96.
利用McCrary(2008)的核密度函數(shù)檢驗(yàn)。
命令是?DCdensity
,介紹見(jiàn)陳強(qiáng)編著的《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》(第二版)第569頁(yè))。如李連友等 (2022) 文中的驅(qū)動(dòng)變量操控圖,再如李芳華等 (2020) 精準(zhǔn)扶貧效果評(píng)估文章里面的檢驗(yàn)。

McCrary J.Manipulation of the running variable in the regression discontinuity design: A density test[J].Journal of econometrics, 2008, 142(2): 698-714.
李芳華,張陽(yáng)陽(yáng),鄭新業(yè).精準(zhǔn)扶貧政策效果評(píng)估——基于貧困人口微觀追蹤數(shù)據(jù)[J].經(jīng)濟(jì)研究,2020,55(08):171-187.
利用 rddensity 這個(gè)命令進(jìn)行檢驗(yàn)
該命令可以觀察驅(qū)動(dòng)或配置變量的變化情況。當(dāng)然?rddensity
?這個(gè)命令不僅可以畫(huà)圖,還可以報(bào)告檢驗(yàn)的結(jié)果。如 Chen et al.(2019) 評(píng)估戶口價(jià)值的文章就使用了這一命令。
Chen, Yu, Shaobin Shi, and Yugang Tang. "Valuing the urban hukou in China: Evidence from a regression discontinuity design for housing prices."?Journal of development Economics?141 (2019): 102381.
第三,檢驗(yàn)前定變量在斷點(diǎn)處是否跳躍。這一步驟的目的是說(shuō)明其他前定變量在斷點(diǎn)處不能跳躍,只有這樣才能保證政策的效應(yīng)是由于文章關(guān)心的核心變量所導(dǎo)致。這里也有兩種表現(xiàn)形式,有的文章通過(guò)回歸的方式展現(xiàn),有的文章則通過(guò)畫(huà)圖 (rdplot
) 的方式展示,但效果都是一樣。不同之處在于,畫(huà)圖的話需要比較多的篇幅但比較直觀,而使用回歸的方式則節(jié)省篇幅,具體可根據(jù)情況來(lái)選擇。如李芳華等 (2020) 精準(zhǔn)扶貧效果評(píng)估文章里面的檢驗(yàn)使用圖表的方式。劉生龍等 (2016) 義務(wù)教育法與中國(guó)城鎮(zhèn)教育回報(bào)率中就使用圖形的方式進(jìn)行檢驗(yàn)。


劉生龍,周紹杰,胡鞍鋼.義務(wù)教育法與中國(guó)城鎮(zhèn)教育回報(bào)率:基于斷點(diǎn)回歸設(shè)計(jì)[J].經(jīng)濟(jì)研究,2016,51(02):154-167.
3.3 參數(shù)還是非 (半) 參數(shù)估計(jì)
沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),需要結(jié)合研究的場(chǎng)景來(lái)選擇??梢詤?shù)和非參數(shù)都匯報(bào)以保證文章估計(jì)結(jié)果的穩(wěn)健。一般來(lái)說(shuō),RDD 模型中的估計(jì)方法一般存在非參數(shù)估計(jì)與參數(shù)估計(jì)兩種。其中,非參數(shù)估計(jì)方法的優(yōu)勢(shì)在于可以不依賴于任何函數(shù)形式對(duì)變量之間的關(guān)系進(jìn)行分析,但其前提條件是在斷點(diǎn)處存在著大量的可觀測(cè)值并能確定每個(gè)觀測(cè)值的具體地理位置 (Imbens and Lemieux,2007)。參數(shù)估計(jì)則可以選擇具體的回歸模型,處理起來(lái)相對(duì)容易,但又可能存在擬合偏差問(wèn)題。因此,又出現(xiàn)了半?yún)?shù)的估計(jì)方法。
具體地,在 Sharp RD 的情形中,參數(shù)法將 Y 在每個(gè)箱體內(nèi)的均值作為因變量,用處理變量、配置變量的多次項(xiàng)作為自變量,在斷點(diǎn)兩邊分別跑回歸,得到斷點(diǎn)左右兩邊因變量的擬合值,兩個(gè)擬合值的差值便是我們想估計(jì)的實(shí)驗(yàn)對(duì)因變量的因果效應(yīng)。但 Gelman and Imbens(2019) 發(fā)現(xiàn),參數(shù)方法存在多項(xiàng)式階數(shù)選擇的敏感問(wèn)題以及其他不受歡迎的統(tǒng)計(jì)特性。因此,在選擇的時(shí)候需要多加注意。非參數(shù)估計(jì)的做法是,利用核密度函數(shù)局部線性回歸來(lái)代替 2SLS 里面一般線性回歸,rdrobust
?命令可以直接實(shí)現(xiàn)這種估計(jì)。當(dāng)然,這里存在估計(jì)權(quán)重的選擇,需要考慮不同的核函數(shù) (Triangle、Epanech、Uniform) 類別。同時(shí),也要考慮不同的帶寬 (CCT等)。半?yún)?shù)方法則介于兩者之間,半數(shù)估計(jì)考慮到了樣本量損失問(wèn)題,同時(shí)也限制了擬合區(qū)間,可以得到更為一致的回歸結(jié)果 (Ito and Zhang,2020;李衛(wèi)兵和張凱霞,2021)
參數(shù)估計(jì)和非參數(shù)估計(jì):
Chen, Yu, Shaobin Shi, and Yugang Tang. "Valuing the urban hukou in China: Evidence from a regression discontinuity design for housing prices."?Journal of development Economics?141 (2019): 102381.
He, Guojun, Shaoda Wang, and Bing Zhang. "Watering down environmental regulation in China."?The Quarterly Journal of Economics?135.4 (2020): 2135-2185.
半?yún)?shù)估計(jì):
Ito, Koichiro, and Shuang Zhang. "Willingness to pay for clean air: Evidence from air purifier markets in China."?Journal of Political Economy?128.5 (2020): 1627-1672.
李衛(wèi)兵,張凱霞.空氣污染是否會(huì)影響犯罪率:基于斷點(diǎn)回歸方法的估計(jì)[J].世界經(jīng)濟(jì),2021,44(06):151-177.
3.4 帶寬的敏感性測(cè)試
斷點(diǎn)估計(jì)結(jié)果的有效性易受帶寬選擇的影響。帶寬越小,斷點(diǎn)兩側(cè)的影響因素越相近,遺漏變量對(duì)因變量的影響越小,因而可以更準(zhǔn)確地估計(jì)斷點(diǎn)處的處理效應(yīng),減輕內(nèi)生性帶來(lái)的估計(jì)偏誤。但過(guò)小的帶寬也會(huì)帶來(lái)樣本量的過(guò)度損失從而導(dǎo)致結(jié)果的有偏性。具體檢驗(yàn)如李衛(wèi)兵和張凱霞 (2021) 空氣污染與犯罪文章中的操作。

如李芳華等 (2020) 使用回歸的方式對(duì)不同的帶寬進(jìn)行穩(wěn)健性檢驗(yàn)。
3.5 安慰劑檢驗(yàn)
如果變量不僅在臨界值處存在跳躍, 而且也在其他值處存在跳躍, 那么變量的跳躍是處置效應(yīng)造成的這一推斷就值得懷疑, 可能還存在其他因素決定了變量在臨界值處的跳躍。選擇一個(gè)不同于斷點(diǎn)的值作為安慰劑斷點(diǎn) (placcebo cutoff points) 。如果斷點(diǎn)回歸結(jié)果變得不顯著,則表明斷點(diǎn)的真實(shí)性。
為了避免樣本選擇的非隨機(jī)性所致的估計(jì)偏誤,確保本文捕捉到的確實(shí)因果效應(yīng),我們可以參考 Baker(2015) 的處理方式進(jìn)行安慰劑檢驗(yàn)。如李衛(wèi)兵和張凱霞 (2021) 空氣污染與犯罪文章中就使用了這一方法。即隨機(jī)分配每一個(gè)樣本到秦嶺-淮河分界線的距離(由 Stata 軟件在一定帶寬范圍內(nèi)隨機(jī)賦值),據(jù)此確定執(zhí)行變量的取值并重新進(jìn)行 RD 估計(jì),然后使這個(gè)隨機(jī)過(guò)程重復(fù) 1000 次。如果這1000 次估計(jì)的核心系數(shù)和 0 無(wú)顯著差異,則表明本文的估計(jì)結(jié)果并非由樣本選擇的非隨機(jī)性所致。詳細(xì)的步驟請(qǐng)自行查看相關(guān)文獻(xiàn)學(xué)習(xí)。

3.6 樣本選擇的敏感性檢驗(yàn)
由于越接近斷點(diǎn)的樣本,越有動(dòng)機(jī)去人為操控,我們刪除最接近斷點(diǎn)的樣本,來(lái)觀察回歸是否顯著(甜甜圈效應(yīng),donut hole approach)。如果仍舊存在,說(shuō)明即使存在人為操控,斷點(diǎn)效應(yīng)仍舊存在。下圖刪除了斷點(diǎn)附近5%,10%,15%,25% 和 30% 的樣本,進(jìn)行了 6 組穩(wěn)健性檢驗(yàn)。圖形給出了回歸系數(shù)和 95% 的置信區(qū)間??芍?,在刪除 20% 及以下時(shí),回歸結(jié)果都保持顯著。具體檢驗(yàn)可以參考連享會(huì)中的推文來(lái)學(xué)習(xí)。當(dāng)然也可以采用回歸的方式來(lái)進(jìn)行檢驗(yàn),如李連友等 (2022) 稅收征管體制改革與社?;鹗杖胛闹芯筒捎眠@一方式,將斷點(diǎn)附近的樣本進(jìn)行刪除。

3.7 其他的穩(wěn)健性檢驗(yàn)
除了上述穩(wěn)健性檢驗(yàn)外,還需要根據(jù)研究的場(chǎng)景進(jìn)行其他相應(yīng)的穩(wěn)健性檢驗(yàn)。如替換被解釋變量,排除其他替代性假說(shuō),擴(kuò)充和縮減樣本,改變固定效應(yīng)的控制層級(jí)等等。
4. 斷點(diǎn)回歸 Stata 操作,立刻上手
以下的操作僅僅是一個(gè)簡(jiǎn)單的例子,更加詳細(xì)的內(nèi)容大家可以自己去學(xué)習(xí)。下面我們推薦 3 篇文獻(xiàn),大家可以去學(xué)習(xí)和復(fù)制,這 3 篇文獻(xiàn)的代碼都是公開(kāi)的,請(qǐng)自己去尋找,倘若這點(diǎn)搜索水平都沒(méi)有,那需要反思下適不適合做研究了。其實(shí),大家把下面幾篇文獻(xiàn)讀懂了在結(jié)合適當(dāng)?shù)膱?chǎng)景進(jìn)行練習(xí),基本就可以掌握 RDD 方法。但是,需要說(shuō)明的是,RDD 模型運(yùn)用的難點(diǎn)在于如何去找到一個(gè)合適的場(chǎng)景(斷點(diǎn)),并不是具體的操作細(xì)則。因此,去鍛煉自己尋找斷點(diǎn)的能力是更為重要的。這也是斷點(diǎn)回歸的難點(diǎn)所在,大家一起努力。希望大家可以找到一個(gè)比較不錯(cuò)的斷點(diǎn)。
最全面的斷點(diǎn)回歸學(xué)習(xí)網(wǎng)址:https://sites.google.com/site/rdpackages/rdrobust
Chen Y, Shi S, Tang Y. Valuing the urban hukou in China: Evidence from a regression discontinuity design for housing prices[J].Journal of development Economics, 2019, 141: 102381.
He G, Wang S, Zhang B. Watering down environmental regulation in China[J].The Quarterly Journal of Economics, 2020, 135(4): 2135-2185.
Jia J, Liang X, Ma G. Political hierarchy and regional economic development: Evidence from a spatial discontinuity in China[J].Journal of Public Economics, 2021, 194: 104352.
簡(jiǎn)單的示例(do文檔見(jiàn)文末的分享鏈接中):
********************************************************************************
** RDROBUST Stata Package
** Do-file for Empirical Illustration
** Authors: Sebastian Calonico, Matias D. Cattaneo, Max H. Farrell and Rocio Titiunik
********************************************************************************
** hlp2winpdf, cdn(rdrobust) replace
** hlp2winpdf, cdn(rdbwselect) replace
** hlp2winpdf, cdn(rdplot) replace ?
********************************************************************************
** net install rdrobust, from(https://sites.google.com/site/rdpackages/rdrobust/stata) replace
********************************************************************************
clear all
set more off
set linesize 80
mata: mata mlib index
********************************************************************************
** Summary Stats
********************************************************************************
use rdrobust_senate.dta, clear
sum vote margin class termshouse termssenate population, sep(2)
********************************************************************************
** rdplot with confidence intervals
********************************************************************************
rdplot vote margin, binselect(es) ci(95) ///
? ? ? graph_options(title("RD Plot: U.S. Senate Election Data") ///
? ? ? ? ? ? ? ? ? ? ytitle(Vote Share in Election at time t+2) ///
? ? ? ? ? ? ? ? ? ? xtitle(Vote Share in Election at time t) ///
? ? ? ? ? ? ? ? ? ? graphregion(color(white)))
**************************************************************************
** rdplot with MSE-optimal choice
**************************************************************************
rdplot vote margin, binselect(es) ///
? ? ? graph_options(title(RD Plot - Senate Elections Data) ///
? ? ? ? ? ? ? ? ? ? ? ? ? ytitle(Vote Share in Election at time t+1) ///
? ? ? ? ? ? ? ? ? ? ? ? ? xtitle(Vote Share in Election at time t))
**************************************************************************
** rdplot with QS partitioning and mimicking variance choice
**************************************************************************
rdplot vote margin, binselect(qsmv) ?///
graph_options(title(RD Plot - Senate Elections Data) ///
? ? ? ? ? ? ? ? ? ? ?ytitle(Vote Share in Election at time t+1) ///
? ? ? ? ? ? ? ? ? ? ?xtitle(Vote Share in Election at time t))
**************************************************************************
** rdrobust
**************************************************************************
rdrobust vote margin
**************************************************************************
** rdrobust with all estimates
**************************************************************************
rdrobust vote margin, all
**************************************************************************
** rdbwselect with all estimates
**************************************************************************
rdbwselect vote margin, all
********************************************************************************
** rdrobust backward compatibility
********************************************************************************
rdrobust vote margin, h(16.79369) b(27.43745)
********************************************************************************
** rdplot to show rdrobust estimate
********************************************************************************
qui rdrobust vote margin
rdplot vote margin if -e(h_l)<= margin & margin <= e(h_r), ///
? ? ? binselect(esmv) kernel(triangular) h(`e(h_l)' `e(h_r)') p(1) ///
? ? ? graph_options(title("RD Plot: U.S. Senate Election Data") ///
? ? ? ? ? ? ? ? ? ? ytitle(Vote Share in Election at time t+2) ///
? ? ? ? ? ? ? ? ? ? xtitle(Vote Share in Election at time t) ///
? ? ? ? ? ? ? ? ? ? graphregion(color(white)))
********************************************************************************
** rdrobust with covariates within the same window (i.e., using same bandwidths)
********************************************************************************
qui rdrobust vote margin
local len = `e(ci_r_rb)' - `e(ci_l_rb)'
rdrobust vote margin, covs(class termshouse termssenate) ///
? ? ? ? h(`e(h_l)' `e(h_r)') b(`e(b_l)' `e(b_r)')
display "CI length change: " round(((`e(ci_r_rb)'-`e(ci_l_rb)')/`len'-1)*100,.01) "%"
********************************************************************************
** rdrobust with covariates with data-driven optimal bandwidths
********************************************************************************
qui rdrobust vote margin
local len = `e(ci_r_rb)' - `e(ci_l_rb)'
rdrobust vote margin, covs(class termshouse termssenate)
display "CI length change: " round(((`e(ci_r_rb)'-`e(ci_l_rb)')/`len'-1)*100,.01) "%"
********************************************************************************
** rdrobust with useless covariate
********************************************************************************
qui rdrobust vote margin
local len = `e(ci_r_rb)' - `e(ci_l_rb)'
rdrobust vote margin, covs(population)
display "CI length change: " round(((`e(ci_r_rb)'-`e(ci_l_rb)')/`len'-1)*100,.01) "%"
********************************************************************************
** rdrobust check covariate "balanced"
********************************************************************************
local covs "class termshouse termssenate population"
local num: list sizeof covs
mat balance = J(`num',2,.)
local row = 1
foreach z in `covs' {
? ?qui rdrobust `z' margin
mat balance[`row',1] = round(e(tau_cl),.001)
mat balance[`row',2] = round(e(pv_rb),.001)
local ++row
}
mat rownames balance = `covs'
mat colnames balance = "RD Effect" "Robust p-val"
mat lis balance
********************************************************************************
** rdrobust with clustering
********************************************************************************
rdrobust vote margin, vce(nncluster state)
********************************************************************************
** rdrobust with clustering and covariates, and different bandwidth
********************************************************************************
rdrobust vote margin, covs(class termshouse termssenate) ///
? ? ? ? ? ? ? ? ? ? ?bwselect(msetwo) vce(nncluster state)
********************************************************************************
** rdbwselect with all estimates
********************************************************************************
rdbwselect vote margin, all
********************************************************************************
** Other examples
********************************************************************************
rdrobust vote margin, kernel(uniform) vce(cluster state)
rdrobust vote margin, bwselect(certwo) vce(hc3)
rdrobust vote margin, h(12 15) b(18 20)
rdrobust vote margin, covs(class) bwselect(cerrd) scaleregul(0) rho(1)
rdbwselect vote margin, kernel(uniform) vce(cluster state) all
rdbwselect vote margin, covs(class) bwselect(msetwo) vce(hc2) all
其他學(xué)習(xí)途徑:連享會(huì)、微信公眾號(hào)等等。
5. 斷點(diǎn)回歸經(jīng)典案例,尋找思路
5.1 稅收分成 ?(稅收征管) 改革
利用所得稅征管范圍在2002年前后的變化來(lái)構(gòu)建斷點(diǎn)回歸模型進(jìn)行因果識(shí)別。代表性文獻(xiàn):
范子英,田彬彬.稅收競(jìng)爭(zhēng)、稅收?qǐng)?zhí)法與企業(yè)避稅[J].經(jīng)濟(jì)研究,2013,48(09):99-111.
李明,李德剛,馮強(qiáng).中國(guó)減稅的經(jīng)濟(jì)效應(yīng)評(píng)估——基于所得稅分享改革“準(zhǔn)自然試驗(yàn)”[J].經(jīng)濟(jì)研究,2018,53(07):121-135.
杜鵬程,王姝勛,徐舒.稅收征管、企業(yè)避稅與勞動(dòng)收入份額——來(lái)自所得稅征管范圍改革的證據(jù)[J].管理世界,2021,37(07):105-118+8.
李連友,黃保聰,席鵬輝.稅收征管體制改革與社?;鹫骼U收入[J].經(jīng)濟(jì)學(xué)動(dòng)態(tài),2022(06):80-96.
5.2 退休制度
中國(guó)的退休制度規(guī)定,男性60歲可以退休,女性工作人員55周歲,女性工人50歲退休,因此中國(guó)的制度使得男女退休的概率在退休年齡前后有急劇的變化。代表性文獻(xiàn):
雷曉燕,譚力,趙耀輝.退休會(huì)影響健康嗎? [J].經(jīng)濟(jì)學(xué)(季刊),2010,(04):1539-1558.
李宏彬,施新政,吳斌珍.中國(guó)居民退休前后的消費(fèi)行為研究[J].經(jīng)濟(jì)學(xué)(季刊),2015,14(01):117-134.
張川川,陳斌開(kāi).“社會(huì)養(yǎng)老”能否替代“家庭養(yǎng)老”?——來(lái)自中國(guó)新型農(nóng)村社會(huì)養(yǎng)老保險(xiǎn)的證據(jù)[J].經(jīng)濟(jì)研究,2014,49(11):102-115.
張川川,John Giles,趙耀輝.新型農(nóng)村社會(huì)養(yǎng)老保險(xiǎn)政策效果評(píng)估——收入、貧困、消費(fèi)、主觀福利和勞動(dòng)供給[J].經(jīng)濟(jì)學(xué)(季刊),2015,14(01):203-230.
鄒紅,喻開(kāi)志.退休與城鎮(zhèn)家庭消費(fèi):基于斷點(diǎn)回歸設(shè)計(jì)的經(jīng)驗(yàn)證據(jù)[J].經(jīng)濟(jì)研究,2015,50(01):124-139.
5.3 地理斷點(diǎn) (空氣污染等)
在跨越秦嶺-淮河分界線時(shí),北方集中供暖政策所致的空氣污染在分界線處呈離散變化,因此,可以利用地理斷點(diǎn)進(jìn)行因果識(shí)別。當(dāng)然,也有其他的地理斷點(diǎn)。如 Melissa Dell 的系列文獻(xiàn)幾乎都是地理斷點(diǎn)(被稱為“斷點(diǎn)女王”)。
Chen Y, Ebenstein A, Greenstone M, et al. Evidence on the impact of sustained exposure to air pollution on life expectancy from China’s Huai River policy[J].Proceedings of the National Academy of Sciences, 2013, 110(32): 12936-12941.
Ebenstein A, Fan M, Greenstone M, et al. New evidence on the impact of sustained exposure to air pollution on life expectancy from China’s Huai River Policy[J].Proceedings of the National Academy of Sciences, 2017, 114(39): 10384-10389.
Jia J, Liang X, Ma G. Political hierarchy and regional economic development: Evidence from a spatial discontinuity in China[J]. Journal of Public Economics, 2021, 194: 104352.
席鵬輝,梁若冰.空氣污染對(duì)地方環(huán)保投入的影響——基于多斷點(diǎn)回歸設(shè)計(jì)[J].統(tǒng)計(jì)研究,2015,32(09):76-83.
李衛(wèi)兵,張凱霞.空氣污染對(duì)企業(yè)生產(chǎn)率的影響——來(lái)自中國(guó)工業(yè)企業(yè)的證據(jù)[J].管理世界,2019,35(10):95-112+119.
李衛(wèi)兵,張凱霞.空氣污染是否會(huì)影響犯罪率:基于斷點(diǎn)回歸方法的估計(jì)[J].世界經(jīng)濟(jì),2021,44(06):151-177.
吳超鵬,李?yuàn)W,張琦.空氣污染是否影響公司管理層人力資本質(zhì)量[J].世界經(jīng)濟(jì),2021,44(02):151-178.
5.4 轉(zhuǎn)移支付 (國(guó)家級(jí)貧困縣人均收入為界)
馬光榮,郭慶旺,劉暢.財(cái)政轉(zhuǎn)移支付結(jié)構(gòu)與地區(qū)經(jīng)濟(jì)增長(zhǎng)[J].中國(guó)社會(huì)科學(xué),2016(09):105-125+207-208.
5.5 義務(wù)教育法 (9年義務(wù)教育)
劉生龍,周紹杰,胡鞍鋼.義務(wù)教育法與中國(guó)城鎮(zhèn)教育回報(bào)率:基于斷點(diǎn)回歸設(shè)計(jì)[J].經(jīng)濟(jì)研究,2016,51(02):154-167.
5.6 股權(quán)結(jié)構(gòu) (50%持股權(quán))
陳林,萬(wàn)攀兵,許瑩盈.混合所有制企業(yè)的股權(quán)結(jié)構(gòu)與創(chuàng)新行為——基于自然實(shí)驗(yàn)與斷點(diǎn)回歸的實(shí)證檢驗(yàn)[J].管理世界,2019,35(10):186-205.
5.7 其他請(qǐng)查閱相關(guān)綜述文章。
如:劉生龍.社會(huì)科學(xué)研究中的斷點(diǎn)回歸設(shè)計(jì):最新代表性研究及其展望[J].公共管理評(píng)論,2021,3(02):140-159.
6. 斷點(diǎn)回歸視頻推薦,繼續(xù)鞏固
斷點(diǎn)回歸模型:https://meeting.tencent.com/v2/cloud-record/share?id=2bc52180-f670-4967-b183-a0f97498bb29&from=3。密碼:QGCW
主流因果推斷方法系列講座回放!
https://www.bilibili.com/video/BV1Rq4y1v7SM/?spm_id_from=333.999.0.0&vd_source=8b95c0c850634a870d80dbe960c3254d
https://www.bilibili.com/video/BV1CU4y1i7tk/?spm_id_from=333.999.0.0&vd_source=8b95c0c850634a870d80dbe960c3254d
B站等相關(guān)途徑。
7. 斷點(diǎn)回歸資料合集,重在積累
Cattaneo M D, Idrobo N, Titiunik R. A practical introduction to regression discontinuity designs:Foundations[M].Cambridge University Press, 2019.
A Practical Introduction to Regression Discontinuity Designs: Volume II.
趙西亮老師的《基本有用的計(jì)量經(jīng)濟(jì)學(xué)》書(shū)籍。
陳強(qiáng)老師的《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,這個(gè)應(yīng)該是人手一本的吧。
連玉君-連享會(huì)教程-https://www.lianxh.cn/news/789f031b0c110.html。學(xué)計(jì)量實(shí)操的應(yīng)該都關(guān)注了。
Lemieux I T. Regression discontinuity designs: A guide to practice[J].Journal of Econometrics, 2008.
Lemieux T, Imbens G. The Regression Discontinuity Design — Theory and Applications[J]. Scholarly Articles, 2008.
Lee D S, Lemieux T. Regression discontinuity designs in economics[J].Journal of economic literature, 2010, 48(2): 281-355.
Gelman A, Imbens G. Why high-order polynomials should not be used in regression discontinuity designs[J].Journal of Business & Economic Statistics, 2019, 37(3): 447-456.
Hausman C, David S. Rapson. Regression discontinuity in time: Considerations for empirical applications[J]Annual Review of Resource Economics, 2018, 10 (1): 533–552.
Nyhan B, Skovron C, Titiunik R. Differential registration bias invoter file data: A sensitivity analysis approach[J].American Journal of Political Science, 2017, (61): 744-760.
Depew B, Eren O. Born on the wrong day? School entry age and juvenile crime[J].Journal of Urban Economics, 2016, 96: 73-90.
He G, Wang S, Zhang B. Watering Down Environmental Regulation in China [J].Quarterly Journal of Economics, 2020, 135(4):2135-2185.
Asher S, Novosad P. Rural roads and local economic development[J].American economic review, 2020, 110(3): 797-823.
謝謙, 薛仙玲, 付明衛(wèi). 斷點(diǎn)回歸設(shè)計(jì)方法應(yīng)用的研究綜述[J]. 經(jīng)濟(jì)與管理評(píng)論, 2019, 35(2):11.
劉沖,諸宇靈,李皓宇.斷點(diǎn)回歸設(shè)計(jì):理論前沿進(jìn)展與新應(yīng)用場(chǎng)景[J].經(jīng)濟(jì)學(xué)報(bào),2022,9(03):325-366.
劉生龍.社會(huì)科學(xué)研究中的斷點(diǎn)回歸設(shè)計(jì):最新代表性研究及其展望[J].公共管理評(píng)論,2021,3(02):140-159.
陳少威,王文芹,施養(yǎng)正.公共管理研究中的實(shí)驗(yàn)設(shè)計(jì)——自然實(shí)驗(yàn)與田野實(shí)驗(yàn)[J].國(guó)外理論動(dòng)態(tài),2016(05):76-84.
余靜文,王春超.新“擬隨機(jī)實(shí)驗(yàn)”方法的興起——斷點(diǎn)回歸及其在經(jīng)濟(jì)學(xué)中的應(yīng)用[J].經(jīng)濟(jì)學(xué)動(dòng)態(tài),2011(02):125-131.
8. 結(jié)語(yǔ)
文章的素材主要來(lái)自相關(guān)的文獻(xiàn)、網(wǎng)站、公眾號(hào)等等,在此表示感謝。創(chuàng)作不易,懇請(qǐng)大家?guī)兔c(diǎn)贊和點(diǎn)亮再看,如果可以的話,還請(qǐng)幫忙轉(zhuǎn)發(fā),讓更多的人看到。感謝您的查閱,如果有緣,下次再會(huì)。最后,祝大家研途坦蕩,成果豐碩!
文中斷點(diǎn)操作及部分資料:
鏈接:https://pan.baidu.com/s/1wJ5s6290jdjmDwJsrDfbWQ
提取碼:wl79

歡迎關(guān)注微信公眾號(hào):經(jīng)管科訊,查看更多內(nèi)容。