小衛(wèi)智庫(kù) | 注意!相關(guān)并不代表存在因果關(guān)系!

北京時(shí)間2021年10月11日下午,2021年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)揭曉。其中Joshua D.Angrist和Guido W.Imbens因“對(duì)因果關(guān)系分析的方法學(xué)貢獻(xiàn)”而獲獎(jiǎng)。
事實(shí)上,因果關(guān)系不僅僅是經(jīng)濟(jì)學(xué)中極其重要的工具,在醫(yī)學(xué)研究中也發(fā)揮著十分重要的作用。
要問(wèn)過(guò)去50年最重要的統(tǒng)計(jì)思想是什么?反事實(shí)因果推斷就位列首位[1]。
現(xiàn)實(shí)中我們常常將相關(guān)和因果關(guān)系混為一談。但事實(shí)上相關(guān)并不意味著存在因果關(guān)系。即使兩個(gè)變量存在很強(qiáng)的相關(guān)性,仍不能證實(shí)兩個(gè)變量之間存在因果關(guān)系。
例如隨著時(shí)間推移,自然界中許多現(xiàn)象都在同時(shí)發(fā)生變化,表現(xiàn)為數(shù)量上的同時(shí)增加或減少,此時(shí)通過(guò)統(tǒng)計(jì)學(xué)的關(guān)聯(lián)分析可能呈現(xiàn)出很強(qiáng)的關(guān)聯(lián)性,但兩者卻沒(méi)有任何的因果關(guān)系[2]。
例如夏季時(shí)乙腦發(fā)病率和冷飲銷量同時(shí)升高從而呈較強(qiáng)的正向關(guān)聯(lián),這是由于夏季高溫所導(dǎo)致的,而兩者之間沒(méi)有因果關(guān)系。
那么相關(guān)和因果之間的區(qū)別和聯(lián)系究竟是什么呢?下面就讓我們一起探討一下吧。

01
統(tǒng)計(jì)相關(guān)性是什么
根據(jù)字典,相關(guān)性是兩個(gè)或多個(gè)事物(或變量)之間相互關(guān)系或聯(lián)系,尤其是僅靠偶然性無(wú)法預(yù)期的事物。
例如今年的水稻高產(chǎn)似乎與今年的氣候變化有關(guān)。我們?cè)谶@里假設(shè)的是因?yàn)闅夂虬l(fā)生了變化,所以今年的水稻產(chǎn)量也增加了。
但是這是唯一的因素嗎?所播種的品種怎么樣?所使用的化肥養(yǎng)分怎么樣?被用來(lái)播種的土地土壤肥力如何?這些因素也需要考慮是否應(yīng)被納入。
因此,盡管水稻高產(chǎn)與氣候變化存在相關(guān)性,但這并不一定意味著因果關(guān)系。

02
統(tǒng)計(jì)學(xué)上因果關(guān)系是什么
因果關(guān)系是指兩個(gè)事件之間存在關(guān)系,且是其中一個(gè)事件影響另一個(gè)事件。
在統(tǒng)計(jì)中,當(dāng)一個(gè)事件B(或變量)的值由于另一個(gè)事件A(或變量)而上升或下降時(shí),我們可以說(shuō)存在因果關(guān)系,即事件A導(dǎo)致了事件B的發(fā)生。
例如,假如你是一名銷售人員,那你的銷售額越高,你的薪資也會(huì)越高。因?yàn)槟愕男劫Y與你的業(yè)績(jī)有關(guān)。業(yè)績(jī)?yōu)橐?,薪資為果。

03
相關(guān)關(guān)系的特點(diǎn)
??相關(guān)性是建立在統(tǒng)計(jì)數(shù)據(jù)之上的。兩個(gè)事物相關(guān)關(guān)系的確定多數(shù)是從大量數(shù)據(jù)中統(tǒng)計(jì)得出來(lái)的。
例如統(tǒng)計(jì)發(fā)現(xiàn)大量肝癌患者中70%都有飲酒史,從而得出飲酒與肝癌具有相關(guān)的結(jié)論,但是我們不能說(shuō)飲酒就會(huì)得肝癌。
單個(gè)個(gè)體中不能得出相關(guān)性,是因?yàn)閭€(gè)體事物的相關(guān)不具有普遍代表性,實(shí)際中重復(fù)出現(xiàn)的概率非常小,沒(méi)有可被利用的現(xiàn)實(shí)意義。
??兩個(gè)事物之間相關(guān)關(guān)系的緊密程度是動(dòng)態(tài)的,會(huì)隨著外界環(huán)境的其他影響因素的變化而變化。
例如你先獲得一個(gè)信息:肝癌患者中70%都有飲酒史,從而得出飲酒和肝癌有很強(qiáng)的相關(guān)性,這時(shí)你可能會(huì)把是否飲酒與肝癌的相關(guān)緊密系數(shù)打100分。
然后你又獲得了另外一個(gè)信息:從事與化學(xué)毒物相關(guān)工作的肝癌患者的數(shù)量是從事與化學(xué)毒物無(wú)關(guān)工作的肝癌患者數(shù)量的3~5倍。
你可能會(huì)把是否從事化學(xué)毒物相關(guān)工作與肝癌的相關(guān)程度打100分,而把是否飲酒與肝癌的相關(guān)程度調(diào)整為60分。
這時(shí),是否飲酒的緊密程度便隨著是否從事化學(xué)毒物相關(guān)工作的納入而發(fā)生了變化。

04
因果關(guān)系的特點(diǎn)
??因果關(guān)系是在一定的前提條件下成立的,就像是萬(wàn)事俱備只欠東風(fēng),東風(fēng)是因,借到箭是果,萬(wàn)事俱備是前提條件,沒(méi)有萬(wàn)事俱備,東風(fēng)就不能成為借到箭的因。
例如上班就能掙錢,好像上班是掙錢的因,掙錢是上班的果,實(shí)際一旦你公司的業(yè)務(wù)在所屬行業(yè)的產(chǎn)業(yè)鏈中無(wú)法提供價(jià)值或被競(jìng)爭(zhēng)對(duì)手淘汰,你所在的公司就會(huì)破產(chǎn),你也會(huì)被辭退,掙錢也是無(wú)從談起。
有因必有果,這是因?yàn)橛绊懝钠渌匾獥l件都已具備。
??因果關(guān)系不是從大量數(shù)據(jù)統(tǒng)計(jì)中得出的結(jié)論,單獨(dú)個(gè)體的事物之間經(jīng)常有自己的因果關(guān)系,就像每個(gè)人都把同樣一件事做成功了,但成功的原因不太一樣。因果關(guān)系具有巨大的主觀性和獨(dú)特性。

小衛(wèi)點(diǎn)睛??課本定位
《衛(wèi)生統(tǒng)計(jì)學(xué)》(人衛(wèi)八版)
第二章?數(shù)據(jù)關(guān)聯(lián)的探索?
知識(shí)點(diǎn)1 ?
兩變量間的相關(guān)關(guān)系是否等價(jià)于因果關(guān)系?
相關(guān)關(guān)系不等價(jià)于因果關(guān)系。
知識(shí)點(diǎn)2 ?
?怎樣才能說(shuō)明兩變量間存在因果關(guān)系?
欲確定兩變量間有無(wú)因果關(guān)系,最有說(shuō)服力的辦法還是設(shè)計(jì)一個(gè)實(shí)驗(yàn)。
在實(shí)驗(yàn)中控制有可能的混雜變量的效應(yīng),固定除x外的其他解釋變量后,如果變量y隨變量x值的變化而變化,此時(shí)可以認(rèn)為是x的變化導(dǎo)致了y的變化,即x和y之間存在因果關(guān)系。
參考文獻(xiàn):
[1]?Gelman A, Vehtari A. What are the most important statistical ideas of the past 50 years?[J]. Journal of the American Statistical Association, 2021 (just-accepted): 1-29.
[2]?李曉松. 衛(wèi)生統(tǒng)計(jì)學(xué)[M]. 北京:人民衛(wèi)生出版社, 2017: 55.