互助問答第1期:工具變量回歸等四個問題及解答

問:用一個工具變量時,內(nèi)生性檢驗(yàn)顯示沒有內(nèi)生性問題;用兩個工具變量時,就會檢驗(yàn)出內(nèi)生性,同時回歸的R平方缺失。請問怎么理解這些結(jié)果?
?
答:這里涉及兩個問題:第一,為什么使用不同工具變量,內(nèi)生性檢驗(yàn)的結(jié)果會不同;第二,為什么工具變量回歸時,R平方會不顯示。
?????? 關(guān)于第一個問題,首先,內(nèi)生性檢驗(yàn)比較的是OLS系數(shù)和工具變量回歸系數(shù)。在工具變量正確使用的前提下,如果兩系數(shù)差異明顯,則說明OLS系數(shù)是有偏差的,也就是說OLS回歸中存在內(nèi)生性問題;如果兩系數(shù)差異不明顯,則說明OLS估計(jì)出來的系數(shù)也是比較準(zhǔn)確的,便不能肯定OLS回歸有內(nèi)生性問題。大家不要過度迷信或依賴這個檢驗(yàn),這個檢驗(yàn)本身并不能告訴您工具變量是否有效;如果工具變量選得不對,檢驗(yàn)結(jié)果就不能說明任何問題。此外,即便工具變量選得正確,不同工具變量的估計(jì)結(jié)果一般也會不同(因?yàn)楣ぞ咦兞炕貧w結(jié)果本質(zhì)上是“局部平均處理效應(yīng)”(LATE)),進(jìn)而可能會造成內(nèi)生性檢驗(yàn)的結(jié)果不同——這不能說明您的結(jié)果是對還是錯。我個人的看法(不一定正確):這個檢驗(yàn)實(shí)際上沒什么用,我自己的研究從來不做該檢驗(yàn)。
?????? 關(guān)于第二個問題,首先,R平方在工具變量回歸中并不是一個重要指標(biāo)。工具變量回歸的最大目的估計(jì)出沒有偏差的因果效應(yīng),而不是找到盡力擬合數(shù)據(jù)的模型。其次,如果工具變量回歸不顯示R平方,最大的可能是R平方算出來是個負(fù)數(shù)。工具變量回歸的第二階段本質(zhì)上是因變量對內(nèi)生變量的預(yù)測值和其他外生變量的回歸,單獨(dú)基于這個回歸計(jì)算出的R平方不會是負(fù)數(shù)。但是,Stata在計(jì)算工具變量回歸R平方時,會把內(nèi)生變量的預(yù)測值替換為內(nèi)生變量本身,這就不能保證R平方一定為正。與上一題同理:顯示不顯示R平方、R平方是否為正并不能說明您工具變量回歸系數(shù)是否可信。
?
問:我讀到某篇論文的一段話(如下圖所示),文章有幾個內(nèi)生自變量,使用這些自變量的滯后一期變量做它們的工具變量,也就是工具變量個數(shù)等于內(nèi)生解釋變量個數(shù)了,為什么還能做過度識別檢驗(yàn)?
?
答:如果單從這段話來看,是做不了過度識別檢驗(yàn)的。不是作者寫錯了,就是他做錯了。
?
問:計(jì)算赫芬達(dá)爾指數(shù)時,如果某一行業(yè)的公司只有1個或者2個,那是否要把這些行業(yè)刪掉?另外,行業(yè)分類是選擇哪一年的行業(yè)分類?
?
答:赫芬達(dá)爾指數(shù)衡量了一個行業(yè)內(nèi)部企業(yè)的集中度,數(shù)值越大,集中度越高。指數(shù)最大值可以取1,表示行業(yè)完全集中在單個企業(yè)手里(完全壟斷),所以即使某個行業(yè)只有一家或兩家公司,計(jì)算該指數(shù)也完全有意義。至于第二個問題,完全取決于您的研究需要:需要計(jì)算哪一年的指數(shù),就用哪一年的數(shù)據(jù)。
?
問:在使用ivtobit模型時,如何進(jìn)行識別不足檢驗(yàn)和弱識別檢驗(yàn)?
答:識別不足檢驗(yàn)看的是工具變量與內(nèi)生變量是否相關(guān),只需要在ivtobit命令后加入first選項(xiàng)匯報(bào)第一階段結(jié)果,然后檢驗(yàn)第一階段中工具變量前面的系數(shù)是否(聯(lián)合)統(tǒng)計(jì)顯著即可。弱識別檢驗(yàn)看的是工具變量與內(nèi)生變量是否足夠相關(guān),我個人推薦第三方命令weakiv(運(yùn)行ssc install weakiv安裝)。在運(yùn)行完ivtobit命令后運(yùn)行weakiv命令(需要仔細(xì)閱讀和學(xué)習(xí)weakiv的幫助文件特別是其中的例子以熟悉其用法)。
學(xué)術(shù)指導(dǎo):張曉峒老師 Ben Lambert
本期解答人:中關(guān)村大街
編輯:李寧寧
統(tǒng)籌:易仰楠
技術(shù):劉子瑗
平臺推廣:姜麗燕
(歡迎轉(zhuǎn)發(fā),歡迎分享;轉(zhuǎn)載請注明出處,引用和合作請留言。本文作者擁有所有版權(quán),原創(chuàng)文章最早發(fā)表于“學(xué)術(shù)苑”。任何侵權(quán)行為將面臨追責(zé)?。?/p>