統(tǒng)計咨詢:為什么我不建議隨便用逐步回歸法構(gòu)建回歸模型?
2023年以來浙中醫(yī)大學(xué)鄭老師開設(shè)了一系列醫(yī)學(xué)科研統(tǒng)計課程,零基礎(chǔ)入門醫(yī)學(xué)統(tǒng)計包括R語言、meta分析、臨床預(yù)測模型、真實世界臨床研究、問卷與量表分析、醫(yī)學(xué)統(tǒng)計與SPSS、臨床試驗數(shù)據(jù)分析、重復(fù)測量資料分析、結(jié)構(gòu)方程模型、孟德爾隨機化等10門課,如果您有需求,不妨點擊下方跳轉(zhuǎn)查看:?
2023年鄭老師多門科研統(tǒng)計課程:多次直播,含孟德爾隨機化方法

先說我的建議
(1)如果你構(gòu)建預(yù)測模型,逐步回歸法可以用。
(2)如果你只是是探討影響因素,盡量不要用逐步回歸法。你覺得自變量太多,那么在單因素分析時候就限制(P值較小者納入多因素回歸),而不是逐步回歸法控制。
下文說理由:
現(xiàn)在很多人知道,回歸分析要么用來探討影響因素,要么可以用來構(gòu)建預(yù)測模型。但是構(gòu)建預(yù)測模型的文章畢竟少數(shù),絕大多數(shù)只是為了探討影響因素。
目前無論是哪個目的,國內(nèi)很多人開展統(tǒng)計分析,構(gòu)建回歸模型篩選自變量,都喜歡用逐步回歸法(向前、向后、雙向)。我不知道是哪里的統(tǒng)計學(xué)教育出問題了,還是就是因為統(tǒng)計學(xué)老師自己都沒有搞清楚?
事實上,逐步回歸法是是給構(gòu)建預(yù)測模型用的,不是探討影響因素用的。它的目的是用最少的因子,成功構(gòu)建出不差于全變量模型(通過用R^2、-2倍對數(shù)似然值或者AIC等指標評價擬合效果),也就是通過軟件的方法,篩選出有用的自變量,其擬合效果不差于全部自變量放入模型,而且較少的自變量個數(shù)有利于模型的構(gòu)建(回歸模型樣本量對自變量個數(shù)有限制)。
但只是探討探討影響因素而非構(gòu)建預(yù)測模型時,逐步回歸法有什么優(yōu)勢?
(1)有人說,逐步回歸法可以減少冗余的自變量
其實,這不是好的解決辦法。冗余的自變量有兩套解決方案。
第一,我們構(gòu)建回歸時候,在考慮哪些可能的影響因素時,就應(yīng)該慎重考慮,不是所有阿狗阿貓都作為候選自變量開展回歸分析,與結(jié)局變量“拉郎配”。
只有與結(jié)局變量可能存在著因果關(guān)系的變量,才推薦開展回歸分析。這一點,是需要從專業(yè)上去考慮的。
第二,在統(tǒng)計分析的時候,若自變量個數(shù)很多,在單因素分析時就卡關(guān),不隨便納入自變量進入最終的多因素回歸模型。一般單因素分析P值較小者納入回歸模型。
(2)逐步回歸法可以把沒有統(tǒng)計學(xué)意義的自變量淘汰出去,它們不應(yīng)該留在模型中
這種理解是不對的!多因素回歸可以允許P值大于0.05的自變量留在模型并報告出來嗎?當(dāng)然可以。而且也推薦呈現(xiàn)在最后報告中,以展現(xiàn)哪些有統(tǒng)計學(xué)意義,哪些沒有統(tǒng)計學(xué)意義。
(3)逐步回歸法效果更好
不見得。逐步回歸法優(yōu)點在于把對因變量影響較小的都淘汰掉,自變量個數(shù)減少了,所以留在模型的自變量效應(yīng)會增強!看起來變美好了。
這個前提是你自變量實在太多了。但是,這種情況是不多見的。如果回歸分析放入太多的自變量,那么逐步回歸法也挽救不了你。
(4)有人說,逐步回歸法可以處理多重共線性
很多時候,由于自變量存在著高度相關(guān)。這個時候,連教科書都推薦試試逐步回歸法呀!
這種做法其實很要命!這是一種完全無視數(shù)據(jù)特點,強行胡亂進行自變量篩選的一種方法。
為什么有多重共線性?多重共線性往往由于變量之間存在著關(guān)聯(lián)性,這種關(guān)聯(lián)性有幾種情況:
第一,這個變量是混雜變量,由于混雜變量與自變量相關(guān),所以造成部分共線性
第二,這個變量是中介變量,中介變量也會造成自變量相關(guān)第三,變量是同個東西。比如年齡這一定量變量和根據(jù)年齡進行分組產(chǎn)生年齡的等級變量,那么原先的年齡定量數(shù)據(jù)和等級變量的年齡就是高度相關(guān),如果它們一同納入模型,就會造成共線性第四,一個事物的兩個屬性,比如身高與坐高,相關(guān)高度相關(guān),如果,如果他們一同納入模型,就會造成共線性
實際上,除了第一點之外,我們在處理多重共線性時,典型的方法是排除造成多重共線性的變量。比如身高坐高在回歸分析應(yīng)該2選1,定量年齡和分類年齡應(yīng)該2選1,中介變量不能納入模型。
詳情請點擊下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650404618&idx=4&sn=56c3315b1ca3a60c9ee56afae1f92103&chksm=83518aa2b42603b4642e9600e1daaf151e7cbdc866e4c683eeebd45a4c03ff61dfff2bb90203&token=1579182731&lang=zh_CN#rd


2023年統(tǒng)計服務(wù)?
2023年,我們將開展從科研設(shè)計、數(shù)據(jù)分析、統(tǒng)計學(xué)報告等醫(yī)學(xué)科研研究方法咨詢與服務(wù)多項服務(wù),若您有課題經(jīng)費可以支持,歡迎您提前和我們聯(lián)系,2022底前采用預(yù)付方式與我們開展合作。?
2023年統(tǒng)計服務(wù)開啟!歡迎提前洽談數(shù)據(jù)分析、科研合作服務(wù)