回歸分析時,單因素P<0.05,而多因素卻沒有意義,我該如何是好?
昨天有有個朋友問我,回歸分析單因素P好多 <0.05,而多因素只有1-2個小于0.05,如何是好。所以我翻箱倒柜找找我兩年前寫得材料,給大家看看。
先單后多,最令人沮喪的,莫過于單因素P<0.05,而多因素大多數(shù)沒有統(tǒng)計學(xué)意義,甚至一個都沒有。這可怎么辦!!怎么回事??!不僅如此,有些時候單因素>0.05,多因素可以出現(xiàn)統(tǒng)計學(xué)差異的驚喜局面哦。
1
單因素、多因素結(jié)果矛盾原因
這種情況的原因是什么?大概原因包括:
(1)多因素回歸自變量個數(shù)太多,樣本量不夠,建模失敗
(2)存在著混雜變量
(3)存在著中介變量
(4)存在著交互效應(yīng)
(5)排除中介變量后,存在著其它多重共線性
主要的原因是存在著混雜變量和中介變量。
2
單因素、多因素結(jié)果矛盾如何處理
如何處理?
當(dāng)然,最重要的是,在多因素回歸分析之前,厘清好各變量的因果關(guān)系。對!借助DAG的方法能夠形成相應(yīng)的因果網(wǎng)絡(luò)。
但是,DAG構(gòu)建并不是那么容易,更多的時候,我們需要借助統(tǒng)計方法,來繪制DAG的連接線
我覺得可以嘗試,“兩因素建模法”和“去因子建模法”來探索自變量為什么先單后多結(jié)果不一致。
兩種方法原理相似,他們的關(guān)系如同逐步回歸法中的“向前逐步”和“向后逐步”方法。也非常容易理解
3
“
兩因素建模法
”案例分析
例1:?Hosmer和Lemeshow于1989年研究了低出生體重嬰兒的影響因素,結(jié)果變量為是否娩出低出生體重兒,考慮的自變量有產(chǎn)婦妊娠前體重、產(chǎn)婦年齡、種族、是否吸煙、早產(chǎn)次數(shù)、是否患高血壓等。(數(shù)據(jù)文件見:logistic_step.sav。)

本文,關(guān)注兩個變量,吸煙與早產(chǎn)次數(shù)
首先是單因素回歸分析的結(jié)果:

在所有結(jié)果中,隨訪次數(shù),沒有統(tǒng)計學(xué)意義,因此多因素排除在外,剩下的全部納入多因素回歸分析(P<0.2)。結(jié)果如下:
詳情請點(diǎn)擊下方:
https://mp.weixin.qq.com/s/nBsU6tZGipuuBikwBoA32g
