如何撰寫應(yīng)用經(jīng)濟(jì)學(xué)論文(上)
如何撰寫應(yīng)用經(jīng)濟(jì)學(xué)論文
Marc F. Bellemare[1]
2020年9月7日
?
?
摘要:
如何寫出好的學(xué)術(shù)論文?盡管許多經(jīng)濟(jì)學(xué)者本能地知道如何做到這一點(diǎn),但很少有人花時(shí)間思考如何撰寫好的研究論文,即使是最成功的經(jīng)濟(jì)學(xué)者也往往很難清楚地回答這個(gè)問題。其原因有二:經(jīng)濟(jì)學(xué)家讀的內(nèi)容(what economists read)以及他們讀的方式(how they read it)。本文的目的是告訴讀者如何撰寫最終能發(fā)表在同行評議期刊上的應(yīng)用經(jīng)濟(jì)學(xué)論文。本文將盡可能詳細(xì)地討論論文的各組成部分,并以常規(guī)的研究項(xiàng)目中各部分呈現(xiàn)的順序來編排。
關(guān)鍵詞:應(yīng)用經(jīng)濟(jì)學(xué),應(yīng)用微觀經(jīng)濟(jì)學(xué),方法論
JEL 分類號: A2, B4
?
“我相信,我們成為什么樣的人,取決于我們的父親在空閑的時(shí)刻教我們什么,當(dāng)他們不想教我們的時(shí)候,我們是由一點(diǎn)點(diǎn)智慧組成的?!?/p>
— Umberto Eco(1988),F(xiàn)oucault’s Pendulum.
1引言
一部好電影會(huì)讓你忘記你是正在看一部電影。同樣,一篇好的研究論文會(huì)讓你忘記你是正在讀一篇研究論文。作者們介紹了他們所做的工作:他們問了自己什么問題,他們是如何回答的,他們是如何確保自己的答案是可靠的。總之,我們可以從他們的研究中學(xué)到一些東西,以用于指導(dǎo)政府或商業(yè)決策。
但正如一部好電影讓你沉浸在它創(chuàng)造的世界中,讓你忘記制作過程中使用的各種主題和技巧一樣,一篇好的研究論文也會(huì)讓你忘記它的整體結(jié)構(gòu)以及作者使用的各種修辭手段。
你如何寫一篇好的研究論文?根據(jù)我的經(jīng)驗(yàn),大多數(shù)研究經(jīng)濟(jì)學(xué)家花在思考這個(gè)問題上的時(shí)間太少,即使是最成功的經(jīng)濟(jì)學(xué)家也很難清晰地回答同一個(gè)問題。
這既與經(jīng)濟(jì)學(xué)家的閱讀內(nèi)容有關(guān),也與他們的閱讀方式有關(guān)。
關(guān)于經(jīng)濟(jì)學(xué)家所閱讀的內(nèi)容,大多數(shù)研究生課程(如行為、發(fā)展、產(chǎn)業(yè)組織、勞動(dòng))的教學(xué)大綱通常包含閱讀所研究領(lǐng)域的優(yōu)秀論文。這些論文影響了該領(lǐng)域研究人員的思維方式以及他們對該主題的了解。例如,發(fā)展經(jīng)濟(jì)學(xué)課程的教學(xué)大綱幾乎肯定會(huì)將Foster and Rosenzweig(1995)和Suri(2011)的文章包含在其技術(shù)采用主題下的閱讀清單。因?yàn)?,在該領(lǐng)域中,這兩篇文章被廣泛認(rèn)為是最好的文獻(xiàn)之一。
這主要適用于低年級的讀者(因?yàn)楦呒墑e的學(xué)者可能在審稿時(shí)接觸到很多質(zhì)量不高的文章),但只閱讀最好的論文也是一把雙刃劍。平心而論,閱讀那些來自于我們同行們關(guān)注話題的論文時(shí),我們會(huì)獲得最大的收獲。同時(shí),這些論文往往是質(zhì)量最高的,即在某一特定話題中最接近完美的論文[2]。但是,如果一個(gè)人所讀的都是完美的論文,那么他就很難了解好論文是怎么形成的。例如,再拿電影舉例,如果你所看的都是英國電影協(xié)會(huì)(British film Institute,BFI)有史以來最偉大的50部電影名單上的電影,而你從未看過任何糟糕(甚至是一般)的電影,那么你將很難發(fā)現(xiàn)到底是什么讓這些電影躋身BFI前50名。
關(guān)于經(jīng)濟(jì)學(xué)家的閱讀方式,大多數(shù)研究生課程的教學(xué)大綱經(jīng)常列出大量的文章,從而使研究生迅速掌握出一種技能,即Mortimer Adler在其著作How to Read a Book中談到的“檢視閱讀”(inspectional reading)。在閱讀學(xué)術(shù)論文時(shí),檢查閱讀包括閱讀引言、查看方法和結(jié)果,以及(可能)在閱讀的下一篇文章之前閱讀結(jié)論。以這種方式閱讀論文可以幫助一個(gè)人了解某一主題的內(nèi)容,但這并不是學(xué)習(xí)如何撰寫好論文的秘訣[3]。
當(dāng)經(jīng)濟(jì)學(xué)家知道如何寫出一篇好的研究論文時(shí),他們通常會(huì)以非結(jié)構(gòu)化、無意識的方式收集這些信息,通常是從顧問、資深同事和合作者的閑聊中收集的。換句話說,正如本文開篇Umberto Eco所說的一樣:他們“在空閑的時(shí)刻……通過一點(diǎn)點(diǎn)知識”學(xué)到了這一點(diǎn),而這些顧問、同事和合著者并沒有試圖教他們。
因此,本文的目標(biāo)是教會(huì)讀者如何撰寫最終將在同行評議期刊上發(fā)表的應(yīng)用經(jīng)濟(jì)學(xué)論文[4]。為了做到這一點(diǎn),研究論文的各個(gè)組成部分將盡可能詳細(xì)地討論,文章的順序大致以各組成部分在實(shí)際研究工作中的順序來編排[5]。
本文的其余部分組織如下。第2節(jié)列出并討論了一篇典型的應(yīng)用經(jīng)濟(jì)學(xué)論文結(jié)構(gòu)。第3節(jié)解釋了如何呈現(xiàn)應(yīng)用論文的理論框架,記住理論經(jīng)濟(jì)學(xué)家很少讀應(yīng)用論文。接下來是論文中真正應(yīng)用的部分:第4節(jié)解釋如何呈現(xiàn)數(shù)據(jù)和描述性統(tǒng)計(jì),第5節(jié)解釋如何呈現(xiàn)實(shí)證框架,第6節(jié)解釋如何討論實(shí)證結(jié)果,包括其局限性。第7節(jié)解釋了如何寫出正確的結(jié)論。因?yàn)橹挥挟?dāng)作者弄清楚自己研究的結(jié)果是什么以及它們的意思后才能完成標(biāo)題、摘要和引言的寫作,所以第8節(jié)才解釋了如何選擇一個(gè)好的標(biāo)題、寫一個(gè)好的引言和摘要。第9節(jié)討論了文獻(xiàn)綜述和背景部分(并非是論文中必須有的部分)。第10節(jié)討論了有關(guān)發(fā)表的事宜。第11節(jié)是總結(jié)。
2結(jié)構(gòu)
在創(chuàng)作任何類型的作品之前,了解這些作品的典型結(jié)構(gòu)是什么樣的,并寫下這種結(jié)構(gòu)的粗略草圖是有幫助的。從最抽象的意義上說,典型的經(jīng)濟(jì)學(xué)論文(無論是否是應(yīng)用論文)的結(jié)構(gòu)如下:
?
1.標(biāo)題
2.摘要
3.引言
4. ……
5.總結(jié)和結(jié)束語
6.參考文獻(xiàn)
?
根據(jù)你寫的論文的類型,第四部分將會(huì)有所改變。由于本文主要探討應(yīng)用論文的寫作,所以上面的結(jié)構(gòu)通常會(huì)被修改為如下結(jié)構(gòu):
1.標(biāo)題
2.摘要
3.引言
4.理論框架
5.數(shù)據(jù)和描述性統(tǒng)計(jì)
6.經(jīng)驗(yàn)框架
7.結(jié)果和討論
8.摘要和結(jié)束語
9.參考文獻(xiàn)
10.附錄
?
該結(jié)構(gòu)并不是一成不變的。有些作者會(huì)調(diào)換第5部分和第6部分的位置,從而使實(shí)證框架部分位于數(shù)據(jù)和描述性統(tǒng)計(jì)部分之前。類似地,一篇研究常規(guī)問題的論文(例如,更強(qiáng)的財(cái)產(chǎn)權(quán)對農(nóng)業(yè)生產(chǎn)力的影響)可能根本不需要一個(gè)理論框架,因?yàn)檫@個(gè)問題背后的理論是眾所周知的,而且還是教科書上的東西?;蛘撸谝灾髸?huì)有一部分介紹重要的研究背景,而這部分既不適合放在引言,也不適合放在描述性統(tǒng)計(jì)部分。
雖然有些論文可能需要對上述結(jié)構(gòu)進(jìn)行大幅度調(diào)整,但是熟悉常規(guī)的結(jié)構(gòu)還是有幫助的。在這種情況下,一個(gè)很好的類比就是:在爵士樂傳奇人物John Coltrane制作 A Love Supreme(1965)(至高無上的愛,一部很前衛(wèi)的作品)之前,他首先學(xué)會(huì)了Blue Train(1957)中波普爵士樂結(jié)構(gòu)(較為僵化和傳統(tǒng))。
這對應(yīng)用經(jīng)濟(jì)學(xué)家意味著什么?這意味著在你打破常規(guī)之前,必須學(xué)會(huì)它們。因此,在考慮寫一篇一般讀者幾乎認(rèn)不出的結(jié)構(gòu)的論文之前,一個(gè)應(yīng)用經(jīng)濟(jì)學(xué)家應(yīng)該確保已經(jīng)寫了足夠多遵循以上結(jié)構(gòu)的論文。換句話說,更有經(jīng)驗(yàn)的研究人員才能做出結(jié)構(gòu)上的改變,因?yàn)樗麄儚淖x者那里積累了足夠的善意,這允許他們稍作改變。
本文的其余部分將不遵循剛才給出的結(jié)構(gòu)。雖然對我來說,寫一篇論文,其后續(xù)章節(jié)的標(biāo)題按照確切的結(jié)構(gòu)順序排列肯定會(huì)更容易,但事實(shí)證明,我們在論文中所展示的結(jié)構(gòu)往往與我們實(shí)際工作的結(jié)構(gòu)相差較大。
3理論框架
由于應(yīng)用經(jīng)濟(jì)學(xué)的目標(biāo)通常是回答這樣的問題:“x影響y嗎?”或者“如果x增加一個(gè)單位,y會(huì)改變多少個(gè)單位?”,因此經(jīng)濟(jì)學(xué)中大多數(shù)應(yīng)用性的工作都是從某種來自變革理論的想法開始的。
雖然許多具有影響力的回歸評估報(bào)告著重于干預(yù)變量是否以及如何影響結(jié)果的,但最好的研究論文往往僅側(cè)重于一個(gè)問題(例如,“擁有土地所有權(quán)如何影響農(nóng)業(yè)生產(chǎn)力?”)或特定問題背后的影響機(jī)制(例如,“土地所有權(quán)提高農(nóng)業(yè)生產(chǎn)力,其原因是土地所有權(quán)允許土地所有者將其土地用作抵押品嗎?”)。因此,一篇文章首先需要關(guān)注的是那些感興趣的因果關(guān)系。換句話說,最好的應(yīng)用經(jīng)濟(jì)學(xué)文章往往只關(guān)注一個(gè)問題,所以你幾乎不可避免地不得不將一些材料排除在最后的計(jì)劃之外[6]。
那么,問題是如何將你的變革理論轉(zhuǎn)化為應(yīng)用經(jīng)濟(jì)學(xué)文章的適當(dāng)理論框架。這里有兩種可能的情況:你正在研究一個(gè)理論家已經(jīng)研究過變革理論的問題,或者你正在研究一個(gè)理論家還沒有研究過變革理論的問題。
在第一個(gè)場景中,有兩個(gè)選項(xiàng)。第一種選擇是在文章中包含一個(gè)理論框架,通過合并或改編他人的理論框架。盡管研究論文常常讓人覺得必須在所有方面進(jìn)行創(chuàng)新,但這種情況很少發(fā)生。尤其是應(yīng)用論文,重要的是研究問題、實(shí)證策略或兩者都是新穎的。在大多數(shù)情況下,使用別人的理論框架是完全可以的——前提是你清楚地說明你正在這樣做。
一個(gè)密切相關(guān)的選擇是調(diào)整別人的理論框架來滿足你的需求——例如,通過合并一個(gè)額外的變量,或者通過做出額外的假設(shè)來滿足你的應(yīng)用需求。
在第二種情況下,當(dāng)你在研究一個(gè)理論家還沒有研究過變革理論的問題時(shí),你必須清楚地陳述你的變革理論。在某些情況下,這可能需要一個(gè)正式的理論模型。在其他情況下,僅僅提出一個(gè)口頭的概念框架就足夠了[7]。在所有情況下,你的理論框架——無論是數(shù)學(xué)的還是口頭的——都應(yīng)該從基本元素開始,并做出必要的假設(shè),以產(chǎn)生“X通過機(jī)制m引起y”的結(jié)果,不能多也不能少。
一個(gè)人可以寫一整本關(guān)于如何寫經(jīng)濟(jì)理論的書(有些人已經(jīng)寫過了;參見Thomson,2011),因此除了以下內(nèi)容之外,關(guān)于這個(gè)話題本文就不再多說了:寫經(jīng)濟(jì)學(xué)理論模型是一種藝術(shù)形式,如果你在研究生階段還沒有學(xué)過如何寫,也許最好與有過這種經(jīng)歷的人合作。在發(fā)表應(yīng)用經(jīng)濟(jì)學(xué)文章時(shí),最好是一個(gè)非正式的、不規(guī)范的概念框架,而不是一個(gè)糟糕的正式理論模型。
也就是說,即使你的工作論文包含了一個(gè)簡明的理論模型,有時(shí)也會(huì)發(fā)生這樣的情況:即審稿人或編輯會(huì)要求你在論文發(fā)表前刪除你的理論模型,或者將該理論模型放在附錄中。如果發(fā)生這種情況,要知道這是常見的,不要感覺被冒犯。從這個(gè)意義上說,在你的論文中有一個(gè)理論框架通常只是一個(gè)信號(in the Spence, 1973 sense),表明你知道自己在做什么。Job-Market Paper尤其如此,其除了要對現(xiàn)有研究做出貢獻(xiàn)外,還應(yīng)被用來展示作者各方面的能力。
4數(shù)據(jù)和描述性統(tǒng)計(jì)
在發(fā)展了你的變革理論之后,你大概正在尋找數(shù)據(jù)來檢驗(yàn)理論。與編寫正式理論模型一樣,以下這些書描寫了有關(guān)數(shù)據(jù)收集的注意事項(xiàng)(調(diào)查數(shù)據(jù)見Deaton,1997或Glewwe and Grosh,2000;隨機(jī)對照試驗(yàn)見Gerber and Green,2012或Glennerster and Takavarasha,2013),因此本節(jié)將不討論數(shù)據(jù)來自哪里,而是假設(shè)您有這些數(shù)據(jù)。本節(jié)將側(cè)重于如何在應(yīng)用經(jīng)濟(jì)學(xué)文章的正文中呈現(xiàn)數(shù)據(jù)。
數(shù)據(jù)和描述性統(tǒng)計(jì)部分回答了讀者關(guān)于數(shù)據(jù)本身的所有問題。具體來說,一個(gè)好的數(shù)據(jù)和描述性統(tǒng)計(jì)部分需要首先討論數(shù)據(jù)的來源,包括數(shù)據(jù)收集的時(shí)間,搜集人員,構(gòu)成樣本的觀察數(shù)據(jù)是如何選擇納入的(即調(diào)查方法,或區(qū)域、社區(qū)、家庭、個(gè)人等是如何選擇的),樣本代表什么人群,目標(biāo)樣本量是多少以及如何確定樣本量(例如,通過功率計(jì)算),實(shí)際樣本量是多少,無答復(fù)率是多少,如果數(shù)據(jù)是縱向的,損耗率是多少,如何處理缺失值(例如,是否只是刪除了觀測值,或是否對某些值進(jìn)行了插補(bǔ),如果是,如何進(jìn)行插補(bǔ))。廣義地說,這里提供的信息允許讀者判斷論文中所包含結(jié)果的外部有效性(有時(shí)也可以判斷它們的內(nèi)部有效性,當(dāng)數(shù)據(jù)存在損失時(shí)就是如此),或者如何將這些結(jié)果用于樣本外預(yù)測。
在介紹了這些基礎(chǔ)知識之后,一個(gè)好的數(shù)據(jù)和描述性統(tǒng)計(jì)部分通過精確和簡明地解釋它們測量的東西以及它們測量的方法來介紹論文中使用的所有變量(所有變量都在論文中有用到)。例如,在發(fā)展中國家的許多農(nóng)村地區(qū),人們的收入來源多種多樣。因此,如果“收入”包括在分析中,讀者需要被告知收入來源是什么。
這可能看起來很乏味,但它包含了重要的信息(如果作為作者的你都覺得很乏味,你可以想象它對讀者來說是什么感覺)。例如,農(nóng)業(yè)發(fā)展文獻(xiàn)中的一個(gè)古老問題,也是我做了相當(dāng)多研究工作的一個(gè)話題:參與農(nóng)業(yè)價(jià)值鏈(通過合約式農(nóng)業(yè),作為種植戶)是否會(huì)讓參與的家庭過得更好(參見Bellemare and Bloem,2018年的綜述)。這通常是通過在家庭是否參與合約式農(nóng)業(yè)的虛擬模型上回歸家庭收入的度量(作為福利的代理變量)來評估的。然而,如果不知道家庭收入的組成部分是什么,就不可能知道它是否包括來自合約式農(nóng)業(yè)(contract farming)的收入。當(dāng)家庭收入包含合約式農(nóng)業(yè)收入時(shí),存在明顯的反向因果關(guān)系問題。而當(dāng)家庭收入不包含合約式農(nóng)業(yè)收入時(shí),反向因果關(guān)系問題要小得多。
好消息是,當(dāng)人們獲得用于收集數(shù)據(jù)的調(diào)查問卷時(shí),提取出這些信息是相對容易的,而且?guī)缀蹩偸沁@樣。此外,呈現(xiàn)這種信息的最好方法是創(chuàng)建變量描述表,其中每一行都是之后用于分析的變量,第一列給出該變量的名稱(括號中是度量單位),第二列給出精確的度量。圖1就是一個(gè)這樣的表。這樣可以通過簡潔的方式呈現(xiàn)大量必要的信息,從而最大限度地減少讀者的不滿:那些想要了解數(shù)據(jù)的人可以閱讀該表,而那些不想了解的人可以跳過表來關(guān)注變量名。

圖1變量描述示例(Bellemare,2012)
?
在介紹了上述內(nèi)容之后,現(xiàn)在是介紹和討論描述性統(tǒng)計(jì)的時(shí)候了。雖然在過去僅僅展示平均值和標(biāo)準(zhǔn)差就已足夠,但當(dāng)處理變量為類別變量時(shí),有必要展示平衡檢驗(yàn)的結(jié)果。表中每一行都是用于分析的變量,平均值和標(biāo)準(zhǔn)差是以處理狀態(tài)為條件顯示的,其中通過報(bào)告組間均值差異的p值來評估各變量的均值是否在不同處理狀態(tài)下有顯著的不同。盡管教科書上的例子涉及兩種處理狀態(tài)——處理和控制——但越來越多的研究包括兩種以上的處理組(treatment arms),因此任何有意義的平衡測試都必須報(bào)告每一組組間差異檢驗(yàn)。對于兩個(gè)處理組,這意味著三種情況,即處理組1與對照組,處理組2與對照組,和處理組1與處理組2。
利用經(jīng)驗(yàn)數(shù)據(jù),這種平衡測試是向讀者展示隨機(jī)化的操作是適當(dāng)?shù)?。對于觀察數(shù)據(jù),我們不會(huì)期望數(shù)據(jù)是平衡的,做平衡測試的目的是評估數(shù)據(jù)的不平衡程度——這一想法來自相關(guān)的文獻(xiàn)(Morgan and Winship,2015)。在處理組和對照組之間完全隨機(jī)分配的情況下,小于10%統(tǒng)計(jì)顯著水平的成對比較差異應(yīng)少于10個(gè),小于20%統(tǒng)計(jì)顯著水平的成對比較差異應(yīng)少于20個(gè),小于1%統(tǒng)計(jì)顯著水平的成對比較差異應(yīng)少于100個(gè)。如果對比結(jié)果報(bào)告了太多系統(tǒng)性差異,那么在估計(jì)效果時(shí),理想情況下應(yīng)該在回歸或匹配上下文匹配中控制相關(guān)協(xié)變量。
除了通常的平均數(shù)和標(biāo)準(zhǔn)差表以及一個(gè)或多個(gè)顯示平衡測試結(jié)果的表之外,良好的數(shù)據(jù)和描述性統(tǒng)計(jì)部分還可以用于非參數(shù)地探索數(shù)據(jù),其具體方法是:當(dāng)相關(guān)變量連續(xù)時(shí),顯示相關(guān)變量的核密度估計(jì)(即至少包括處理和控制變量,但控制也可能是異質(zhì)性處理效應(yīng)來源的因素);當(dāng)相關(guān)變量是類別變量時(shí),展示相關(guān)變量的直方圖;或當(dāng)處理變量和結(jié)果都是啞變量時(shí),顯示交叉表(即二乘二表)。
在編寫數(shù)據(jù)和描述性統(tǒng)計(jì)部分時(shí),應(yīng)該避免幾個(gè)重要的錯(cuò)誤。第一個(gè)這樣的錯(cuò)誤是寫出了一個(gè)平淡無奇的手段列舉。如果性別變量僅被用為控制變量,那么陳述“37.4%的受訪者是女性”就沒有什么意義,因?yàn)樽x者可以自行查找;這里唯一值得討論的變量通常是因變量和自變量以及任何用于識別的變量(例如,工具變量或驅(qū)動(dòng)變量(forcing variable)),或任何真正重要的變量。通常,一個(gè)很好的經(jīng)驗(yàn)法則是將描述性統(tǒng)計(jì)的討論保持在幾句話之內(nèi)。
第二個(gè)這樣的錯(cuò)誤是在討論數(shù)據(jù)和描述性統(tǒng)計(jì)時(shí)使用了過去式。上面的例子說明了“37.4%的受訪者是女性”,而不是“37.4%的受訪者過去是女性”。在使用英語進(jìn)行科學(xué)交流時(shí),使用現(xiàn)在時(shí)討論數(shù)據(jù)或結(jié)果是更有效。正如應(yīng)該避免使用被動(dòng)語態(tài)一樣,也應(yīng)該避免使用過去時(shí)態(tài),除非是在總結(jié)和結(jié)束語中。
最后,另一個(gè)錯(cuò)誤是,呈現(xiàn)的數(shù)字要么因?yàn)樘《刑嗟男?shù)位(通常,三位小數(shù)就足夠了,而且無論如何,總是可以通過縮放一個(gè)變量,使其大小與其他變量的大小相適應(yīng)),要么在表格中呈現(xiàn)了難以解釋的數(shù)字,如1.37e+8,或者任何讀者不熟悉的單位(例如,如果需要,總是可以用幾千或幾十萬來表示美元金額)。換句話說,即使在實(shí)際回歸中,使用的是收入的對數(shù),但描述性統(tǒng)計(jì)表也應(yīng)該報(bào)告收入水平的平均值,而不是收入對數(shù)的平均值。
最后,盡管數(shù)據(jù)和描述性統(tǒng)計(jì)部分中的許多內(nèi)容好像是無用的裝腔作勢,但是正如前面所說的那樣,一個(gè)好的數(shù)據(jù)和描述性統(tǒng)計(jì)部分應(yīng)該可以讓讀者對因果關(guān)系的符號和大小形成合理預(yù)期,并了解在給定的條件作用域中,這種關(guān)系可能如何變化。
5實(shí)證框架
在討論數(shù)據(jù)并呈現(xiàn)描述性統(tǒng)計(jì)數(shù)據(jù)后,你通常會(huì)轉(zhuǎn)向討論你的實(shí)證框架,即你所使用的實(shí)證研究設(shè)計(jì)。
一個(gè)實(shí)證框架由兩個(gè)相關(guān)的部分組成:(一)估計(jì)策略(即估計(jì)什么,如何估計(jì),以及如何進(jìn)行統(tǒng)計(jì)推斷),和(二)識別策略(即什么樣的數(shù)據(jù)特征允許做出因果陳述,或者如果這不可能,我們?nèi)绾沃牢覀冋诮咏龀鲞@樣的陳述)。
5.1估計(jì)策略
估計(jì)策略通常包括為回答研究問題而估計(jì)的方程式。雖然精明的讀者可以通過查看論文中的表格來回顧論文中的估計(jì)方程,但這并不總是可能的。無論如何,讀者應(yīng)該做的工作量應(yīng)該保持在最低限度,因此提出待估算的方程式在很大程度上是簡潔的。
理想情況下,這些方程將盡可能簡約。雖然一個(gè)回歸可能包括10到15個(gè)控制變量,但最好將所有這些都放入控制變量的向量X中。在一個(gè)估計(jì)框架中,什么樣的變量值得在方程中顯示出來?首先,因變量(y)、處理變量(D或T)、控制向量(X)、截取項(xiàng)()和誤差項(xiàng)()應(yīng)該一起包括在內(nèi)。
最好遵循以下幾個(gè)范式,順序不分先后:
·??????? 從最小(例如個(gè)人)到最大(例如區(qū)域),所有變量都應(yīng)有適當(dāng)?shù)南聵?biāo),通常標(biāo)為等。
·??????? 拉丁字母表示變量。希臘字母表示系數(shù)。
·??????? 在估計(jì)策略部分中,如果同一個(gè)等式使用在了不同的情況下,那么系數(shù)也應(yīng)該有不同的下標(biāo)。換句話說,如果β被用來表示y對D的回歸系數(shù),那么它就不應(yīng)該被再用來表示y對D和x的回歸中的系數(shù)——這兩個(gè)的意思并不相同,用來表示它們的符號也應(yīng)該不同。最好給每個(gè)系數(shù)加上數(shù)字下標(biāo):在前一種情況下,D的系數(shù)將被表示為β,而在后一個(gè)情況中則是β1。也可以在每個(gè)系數(shù)上加上字母下標(biāo),例如βr和βs可以分別表示同一系數(shù)在簡約式(reduced-form)和結(jié)構(gòu)式(structural-form)中的估計(jì)系數(shù)。
·??? 估計(jì)策略部分還應(yīng)具體說明用什么方法來進(jìn)行估計(jì)。我們通常對感興趣,但可以用許多不同的方法來估計(jì),如參數(shù)、半?yún)?shù)或非參數(shù)方法。當(dāng)結(jié)果變量為啞變量時(shí),讀者需要知道是否使用了線性概率模型、probit或logit模型。在不明確的情況下,還需要指定估計(jì)量(例如,最小二乘、最大似然或廣義矩量法)。
·??????? 在介紹了可估計(jì)的方程之后,應(yīng)該討論相關(guān)的假設(shè)檢驗(yàn)。在形如下列回歸式中:
?

·??????? 估計(jì)策略部分還需要討論推斷,即標(biāo)準(zhǔn)誤差是否穩(wěn)健以及如何穩(wěn)?。ㄈ绻牵瑢κ裁捶€(wěn)??;如果使用Huber-sandwich-White校正,僅僅說標(biāo)準(zhǔn)誤差是穩(wěn)健的是不夠的,但有必要說它們對異方差是穩(wěn)健的),它們是否以及如何被聚類(如果是,在什么水平上聚類以及為什么聚類;請參見Abadie et al.,2017),以及是否使用抽樣權(quán)重來使樣本更接近感興趣的人群(如果是,它們是如何構(gòu)造的;參見Solon et al.,2015)。
5.2識別策略
在呈現(xiàn)和討論估計(jì)方程后,有必要討論如何識別與因果關(guān)系判斷有關(guān)的系數(shù)。
隨著時(shí)間的推移,“識別”一詞經(jīng)歷了幾種含義(Lewbel,2019)。不管怎樣,“識別”一詞在當(dāng)前的應(yīng)用論文中經(jīng)常指因果判斷。什么是因果判斷?它指的是:一個(gè)系數(shù)不僅僅反映了因變量y和一些的變量D之間的部分相關(guān),而是反映了一種因果關(guān)系。
雖然一個(gè)無偏系數(shù)估計(jì)意味著因果關(guān)系的系數(shù)估計(jì),但不能反過來這樣說。事實(shí)上,在某些情況下,雖然人們知道一個(gè)系數(shù)是有偏的,但在統(tǒng)計(jì)上顯著的系數(shù)估計(jì)仍然可以用來表示因果關(guān)系。
例如,假設(shè)變量D是連續(xù)且隨機(jī)賦值的,同時(shí)你有結(jié)果變量y和控制向量X的數(shù)據(jù)。試想一下,受試者完全符合D,那么原則上你就可以估計(jì)平均處理效果(ATE)。但變量D的衡量是有誤差的,即當(dāng)輸入數(shù)據(jù)D時(shí),就會(huì)存在一定程度的誤差[8]。在這種情況下,當(dāng)被拒絕時(shí),我們?nèi)匀豢梢哉f,我們發(fā)現(xiàn)了D對y的因果關(guān)系影響,并提示說,這種影響是偏向于零的(或者,我們可以說,我們估計(jì)了實(shí)際影響的絕對值的下限)。有時(shí),即使變量D存在著系統(tǒng)性測量誤差,還是可以這樣說,因?yàn)樵谀承┣闆r下,系統(tǒng)性測量誤差會(huì)導(dǎo)致的估計(jì)值偏向于零,但這種情況要少見得多。
如果你足夠幸運(yùn),即在你的處理變量中有實(shí)驗(yàn)性的變化,以及平行趨勢檢驗(yàn)表明處理組和對照組是隨機(jī)分配的,你的識別策略部分可以很短,因?yàn)槟阃ㄟ^隨機(jī)分配實(shí)現(xiàn)了對因果關(guān)系的判斷。換句話說,你可以估計(jì)Pearl(2009)所指的,即x對y的影響。
如果你的處理變量中有實(shí)驗(yàn)性的變化,但平行趨勢檢驗(yàn)表明處理組和對照組的觀測值并不是隨機(jī)分配的,你的識別策略部分也可以很短,因?yàn)槟阒恍枰忉屓绾瓮ㄟ^添加控制變量,來糾正這種情況,但只是在某種程度上,因?yàn)楫?dāng)可觀察到的不平衡時(shí),不可觀察到的也可能不平衡。
如果處理變量中沒有實(shí)驗(yàn)性的變化,那么就有很多工作需要完成。為了簡潔起見,本文不能也不會(huì)用觀測數(shù)據(jù)對因果關(guān)系進(jìn)行深入研究(如果想要閱讀完整的介紹,請參見Morgan and Winship,2015)。然而,一個(gè)好的識別策略還是需要討論一些必要的內(nèi)容。
·??????? 直觀地解釋為什么你的結(jié)果可以用來解釋因果關(guān)系。實(shí)際上,這意味著你必須告訴你的讀者,為什么你的結(jié)果可以做出比以往更準(zhǔn)確的因果判斷。
·??????? 在最好的情況下,這是因?yàn)槟阌幸粋€(gè)研究設(shè)計(jì)(例如,一個(gè)嚴(yán)格外生的工具變量,如彩票),其可以實(shí)現(xiàn)隨機(jī)分配的作用(即隨機(jī)分組)。在不太理想的情況下(例如,一個(gè)看似外生的工具變量;參見Conley et al.,2012),你需要解釋為什么,即使你沒有做出干凈明確的因果關(guān)系判斷,但你的結(jié)果是現(xiàn)有文獻(xiàn)中最好的[9]。
·??????? 依次討論以下三種內(nèi)生性問題的來源:反向因果、遺漏變量、測量誤差,解釋這些內(nèi)生性問題在你的研究中是否非常關(guān)鍵,以及你是如何處理這些內(nèi)生性問題的。如果這里的確有問題,請大膽承認(rèn)它們,并解釋它們對你的估計(jì)系數(shù)將帶來什么樣的偏差。不要謊稱你的論文能做什么以及不能做什么!
·??????? 做到這點(diǎn)后,還需要考慮另一個(gè)問題,即違反SUTVA(個(gè)體處理穩(wěn)定性假設(shè))。SUTVA的含義是如果你想研究對的影響,其中i表示單個(gè)個(gè)體,t表示時(shí)間,那么的值必須不能影響、或的值,即只能影響。然而SUTVA可能非常難滿足。也就是說,人們可以經(jīng)常檢驗(yàn)是否違反了SUTVA假定;參見Burke et al.(2019)的論文,作者們很好地處理了違反SUTVA的問題。
·??????? 由于這是極其重要的,因此在強(qiáng)調(diào)一次:如果你并沒有發(fā)現(xiàn)因果關(guān)系,不要謊稱你的論文能做什么以及不能做什么!編輯和審稿人更愿意處理那些作者坦率地承認(rèn)其文章局限性的稿件,而不是那些作者試圖欺騙讀者的稿件。簡單地說:前一種稿件比后一種稿件被接受的機(jī)會(huì)要大得多。
[1] Northrop Professor, Department of Applied Economics, and Director, Center for International Food and Agricultural Policy, University of Minnesota, 1994 Buford Avenue, Saint Paul, MN 55108, Web: http://www.marcfbellemare.com, Email: mbellema@umn.edu.
[2] 也就是說,如果每個(gè)人都讀同一篇論文,而沒有讀其他論文,一個(gè)不健康的群體思維動(dòng)態(tài)(an unhealthy group-think dynamic)就會(huì)在研究某一特定主題的學(xué)者中形成,這可能會(huì)導(dǎo)致多年的學(xué)術(shù)努力浪費(fèi)在回答錯(cuò)誤的問題上,或試圖用錯(cuò)誤的方法來回答問題。
[3] 了解是成功的一半,因此了解許多讀者會(huì)仔細(xì)閱讀你的論文可以讓你成為一個(gè)更有效的作者,因?yàn)檫@會(huì)迫使你在撰寫引言、方法和結(jié)果部分以及結(jié)論時(shí)投入更多的思考。如果你知道許多讀者不太愿意閱讀,比如背景部分,那么你就應(yīng)該在介紹部分陳述該部分最重要的內(nèi)容。在論文中漏掉重要信息是非常嚴(yán)重的失誤。學(xué)術(shù)作家所犯的第二大罪過是委托讀者(commission),其包括迫使讀者在論文中尋找特定的信息。而讀者時(shí)間成本很高,因此普通讀者更可能放棄閱讀該論文,而非自行尋找信息。當(dāng)一個(gè)相對初級的學(xué)者(如博士生或助理教授)為了給更高級的讀者(如教師顧問、期刊編輯或期刊審稿人)留下深刻印象而寫作時(shí),尤其如此。
[4] 雖然我主要指的是在談到“應(yīng)用論文”時(shí),通過簡化形式的方法來評估興趣因果關(guān)系的文章,但本文中的許多建議適用于其他類型的實(shí)證論文,如描述性或結(jié)構(gòu)性論文。
[5] “研究項(xiàng)目”指的是回答給定研究問題的整個(gè)研究過程,從想法到發(fā)表。
[6]這并不是說,沒有同時(shí)研究幾個(gè)研究問題的論文。但是,在這個(gè)時(shí)候,經(jīng)濟(jì)學(xué)界傾向于那些很好地回答一個(gè)單一的、相對狹窄的研究問題。
[7] 一種可能是在沒有數(shù)學(xué)的情況下,用語言進(jìn)行理論論證,并將數(shù)學(xué)留在附錄中。例如,見《桑切斯·德·拉·塞拉》(2020)。
[8] 正如一位同事所指出的,如果D是二進(jìn)制的,任何測量誤差都不可能是經(jīng)典的,因?yàn)樗^察到的D將與D的真值負(fù)相關(guān)。
[9] 這假定你的研究設(shè)計(jì)必須是最好的。如果您的研究設(shè)計(jì)并不是最好的話,除非你顯著提高了外部有效性,否則你需要向下調(diào)整你的目標(biāo)期刊集。