因果推斷書籍推薦
1、因果推斷是什么?
因果和相關(guān)的區(qū)別:他們兩個不一樣。
因果關(guān)系:當(dāng)一個事件的出現(xiàn)導(dǎo)致、產(chǎn)生或決定了另一個事件的出現(xiàn),這兩個事件之間的關(guān)系就被稱為因果關(guān)系。例如,外面正在下雨,不帶雨具出門會被淋濕衣服。下雨和淋濕衣服之間就是因果關(guān)系, 下雨是原因,淋濕衣服是結(jié)果。
相關(guān)關(guān)系:客觀現(xiàn)象存在的一種非確定的相互依存關(guān)系。即自變量的每一個取值,因變量由于受隨機(jī)因素影響,與其所對應(yīng)的數(shù)值是非確定性的。相關(guān)分析中的自變量和因變量沒有嚴(yán)格的區(qū)別,可以互換。相關(guān)關(guān)系不等同于因果關(guān)系。因果關(guān)系必定是相關(guān)關(guān)系,而相關(guān)關(guān)系不一定是因果關(guān)系。
正確的因果關(guān)系可以發(fā)現(xiàn)事物本質(zhì)現(xiàn)象,從而更好的挖掘事物背后的原因,做出更加準(zhǔn)確的決策。因此相關(guān)是做預(yù)測,因果是做決策。如果沒有因果容易造成辛普森悖論(比如整個數(shù)據(jù)集來看鍛煉增加膽固醇的風(fēng)險,但是事實是這樣嗎?)。
例如:路面潮濕和帶傘是具有相關(guān)關(guān)系的,但是不具有因果關(guān)系。
那之間為會有相關(guān)關(guān)系咧?大家可以自己想一想。
2、因果推斷框架
因果推斷主要有兩大框架領(lǐng)域:分別是
2.1 Rubin虛擬事實模型
通過尋找合適的對照組,進(jìn)行試驗,從而探究某個實驗變量是否是結(jié)果變量的原因。
2.2?Pearl因果圖模型
模型由有向圖和觀測數(shù)據(jù)構(gòu)成,通過一些算法或者方法去推斷變量之間是否存在因果關(guān)系進(jìn)行連接,從而探究變量之間的因果關(guān)系。
3、因果書籍推薦
Rubin虛擬事實模型
what if causal (rubin)
Pearl因果圖模型
大數(shù)據(jù)中的因果發(fā)現(xiàn)(蔡瑞初)
Causal Inference in Statistics A Primer (Judea)
4、一些感想
我自己感覺更會傾向于因果圖模型,因為針對實驗、或者潛在因果無法做實驗,比如吸煙對孕婦影響、酗酒對壽命影響等等。但是存在即真理,每個人看待的事物的思維方式不一樣,大家可以根據(jù)自己喜好去閱讀書籍。
接下來作為統(tǒng)計學(xué),模擬實驗必不可少,關(guān)于因果推斷的軟件代碼,我也會抽時間給大家介紹一下的。