互助問(wèn)答第69期:面板數(shù)據(jù),內(nèi)存不足和暫元問(wèn)題

今日問(wèn)題1
?您好!我的數(shù)據(jù)是城市_行業(yè)_年份的面板數(shù)據(jù),被解釋變量是0、1的啞變量,我在回歸中同時(shí)控制了隨時(shí)間變化的城市固定效應(yīng)以及隨時(shí)間變化的行業(yè)固定效應(yīng),我的基本回歸是線性概率模型,作為穩(wěn)健性檢驗(yàn),我想同時(shí)看一下probit和logit的回歸結(jié)果,logit模型和probit模型能否控制隨時(shí)間變化的城市固定效應(yīng)和隨時(shí)間變化的行業(yè)固定效應(yīng),是不是我在stata中需要使用xtprobit和xtlogit命令?
? ??在方程中我需要控制隨時(shí)間變化的城市固定效應(yīng)和隨時(shí)間變化的行業(yè)固定效應(yīng),方程中放入城市#年份行業(yè)#年份與放入i.城市#i.年份?i.行業(yè)#i.年份這兩種放入有區(qū)別嗎?
? ??如果可以使用xtprobit、xtlogit命令,在stata中該如何處理高維控制的問(wèn)題,要控制隨時(shí)間變動(dòng)的城市固定效應(yīng)和隨時(shí)間變動(dòng)的行業(yè)固定效應(yīng),如果是線性概率模型,我直接使用reghdfe命令,如果是logit、probit模型該如何辦?我試試直接使用xtlogit、xtprobit命令?xtlogit/xtprobit y x?城市#年份行業(yè)#年份運(yùn)行速度非常慢,一個(gè)回歸方程可能就需要半天的時(shí)間。
今日解答1
這兩者是有區(qū)別的。后者使用的是因子模型,相當(dāng)于添加了一系列的虛擬變量,而前者出現(xiàn)的是兩個(gè)變量的交乘項(xiàng)。因此,為控制此類固定效應(yīng),應(yīng)該選擇使用因子模型。
至于運(yùn)算速度方面,運(yùn)算慢主要是模型難以收斂。建議:1,限制logit的迭代次數(shù);2,嘗試多操作幾次,初始點(diǎn)的不同,收斂的速度也會(huì)不一樣;3,減少不必要的虛擬變量,也會(huì)有所改善。
注:運(yùn)算速度慢還有其他可能的原因,比如電腦的處理器性能和內(nèi)存大小。當(dāng)變量過(guò)多的時(shí)候會(huì)導(dǎo)致數(shù)據(jù)量膨脹,此時(shí)影響運(yùn)算速度。這個(gè)和stata版本也有關(guān),支持多核運(yùn)算的版本要快一些。在極端情況下還可以考慮用Python做回歸,指定求解的各種細(xì)節(jié)(甚至包括并發(fā)線程數(shù)!)都可以加速。
今日問(wèn)題2
我們回歸方程中如果控制的固定效應(yīng)特別多,超過(guò)stata的內(nèi)存時(shí),我們使用reghdfe命令,如果現(xiàn)在我想使用probit、logit回歸,同樣出現(xiàn)控制的固定效應(yīng)過(guò)多,超過(guò)stata的內(nèi)存,該怎么辦?在stata中該如何設(shè)定?
今日解答2
Set memory命令可以擴(kuò)大stata占用內(nèi)存的上限。但是支持運(yùn)算數(shù)據(jù)的大小上限基本取決于內(nèi)存條的大小,在任務(wù)管理器可以看電腦內(nèi)存占用情況。和上個(gè)問(wèn)題類似,很多時(shí)候需要一臺(tái)高性能的電腦,32GB的內(nèi)存處理億級(jí)數(shù)據(jù),有時(shí)候都需要優(yōu)化算法。Stata對(duì)變量的數(shù)目、觀測(cè)值總數(shù)都有限制,并且一般數(shù)據(jù)大小不能高于電腦的內(nèi)存。否則就需要調(diào)用虛擬內(nèi)存,運(yùn)行速度大幅下降。即使如此,還不一定能正常運(yùn)算。同時(shí)stata13和stata14有32位版本和64位版本,后者支持自動(dòng)擴(kuò)大內(nèi)存,前者大概只支持1GB左右的內(nèi)存空間。你需要結(jié)合報(bào)錯(cuò)的具體內(nèi)容,看解決辦法。
今日問(wèn)題3
這個(gè)文件名中有暫元怎么處理
.?forvalues i=2/7{
?2.??merge?m:m?stkcd?year?using"C:\Users\徐曉慧\Documents\corporate governance andCSR\"`i'_Basic.dta""
?3.? keep if _merge==3
?4.? drop _merge
?5.? }?
出現(xiàn)錯(cuò)誤
invalid '2_Basic.dta'
今日解答3
修改完如下:
forvalues i=2/7{
?merge?m:m?stkcd?year?using?"C:/Users/徐曉慧/Documents/corporategovernance and CSR/`i'_Basic.dta"
?keep if _merge==3
?drop _merge
? }
報(bào)錯(cuò)原因:stata里“\”還有轉(zhuǎn)義符的作用。因此,之前的代碼會(huì)有報(bào)錯(cuò)。
學(xué)術(shù)指導(dǎo):張曉峒老師
本期解答人:隨風(fēng)、海藍(lán)
編輯:海藍(lán)
統(tǒng)籌:易仰楠?李丹丹
技術(shù):知我者?趙雅軒?郭凱
往期回顧
互助問(wèn)答第67期:?中介效應(yīng)問(wèn)題
互助問(wèn)答第66期:?回歸對(duì)數(shù)形式以及事件研究法的t值計(jì)算問(wèn)題
互助問(wèn)答第65期:?靜態(tài)面板模型可以用GMM估計(jì)嗎?
互助問(wèn)答第64期:傾向得分匹配等問(wèn)題

長(zhǎng)按二維碼識(shí)別關(guān)注我們
如果您在計(jì)量學(xué)習(xí)和實(shí)證研究中遇到問(wèn)題,請(qǐng)及時(shí)發(fā)到郵箱szlw58@126.com,專業(yè)委員會(huì)有30多名編輯都會(huì)看,您的問(wèn)題會(huì)得到及時(shí)關(guān)注!請(qǐng)您將問(wèn)題描述清楚,任何有助于把問(wèn)題描述清楚的細(xì)節(jié)都能使我們更方便地回答您的問(wèn)題,提問(wèn)細(xì)則參見(jiàn):實(shí)證研究互助平臺(tái)最新通知
如果您想成為問(wèn)題解答者,在幫助他人過(guò)程中鞏固自己的知識(shí),請(qǐng)發(fā)郵件至szlw58@126.com(優(yōu)先)或給本公眾號(hào)留言或加微信793481976給群主留言,我們誠(chéng)摯歡迎熱心的學(xué)者和學(xué)生。具體招募信息請(qǐng)參見(jiàn):實(shí)證研究互助平臺(tái)志愿者團(tuán)隊(duì)招募公告
鮮活的事例更有助于提高您的研究水平,呆板的教科書(shū)讓人生厭。如果您喜歡,請(qǐng)?zhí)岢瞿膯?wèn)題,也請(qǐng)轉(zhuǎn)發(fā)推廣!
(歡迎轉(zhuǎn)發(fā),歡迎分享;轉(zhuǎn)載請(qǐng)注明出處,引用和合作請(qǐng)留言。本文作者擁有所有版權(quán),原創(chuàng)文章最早發(fā)表于“論文導(dǎo)向計(jì)量實(shí)證社區(qū)”。任何侵權(quán)行為將面臨追責(zé)?。?/p>
互助問(wèn)答第69期:面板數(shù)據(jù),內(nèi)存不足和暫元問(wèn)題的評(píng)論 (共 條)
