最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

統(tǒng)計咨詢:為什么我不建議隨便用逐步回歸法構(gòu)建回歸模型?

2023-03-27 15:43 作者:鄭老師妙趣橫生統(tǒng)計學(xué)  | 我要投稿

2023年以來浙中醫(yī)大學(xué)鄭老師開設(shè)了一系列醫(yī)學(xué)科研統(tǒng)計課程,零基礎(chǔ)入門醫(yī)學(xué)統(tǒng)計包括R語言、meta分析、臨床預(yù)測模型、真實世界臨床研究、問卷與量表分析、醫(yī)學(xué)統(tǒng)計與SPSS、臨床試驗數(shù)據(jù)分析、重復(fù)測量資料分析、結(jié)構(gòu)方程模型、孟德爾隨機化等10門課,如果您有需求,不妨點擊下方跳轉(zhuǎn)查看:?

2023年鄭老師多門科研統(tǒng)計課程:多次直播,含孟德爾隨機化方法

先說我的建議

(1)如果你構(gòu)建預(yù)測模型,逐步回歸法可以用。

(2)如果你只是是探討影響因素,盡量不要用逐步回歸法。你覺得自變量太多,那么在單因素分析時候就限制(P值較小者納入多因素回歸),而不是逐步回歸法控制。

下文說理由:
現(xiàn)在很多人知道,回歸分析要么用來探討影響因素,要么可以用來構(gòu)建預(yù)測模型。但是構(gòu)建預(yù)測模型的文章畢竟少數(shù),絕大多數(shù)只是為了探討影響因素。

目前無論是哪個目的,國內(nèi)很多人開展統(tǒng)計分析,構(gòu)建回歸模型篩選自變量,都喜歡用逐步回歸法(向前、向后、雙向)。我不知道是哪里的統(tǒng)計學(xué)教育出問題了,還是就是因為統(tǒng)計學(xué)老師自己都沒有搞清楚?

事實上,逐步回歸法是是給構(gòu)建預(yù)測模型用的,不是探討影響因素用的。它的目的是用最少的因子,成功構(gòu)建出不差于全變量模型(通過用R^2、-2倍對數(shù)似然值或者AIC等指標評價擬合效果),也就是通過軟件的方法,篩選出有用的自變量,其擬合效果不差于全部自變量放入模型,而且較少的自變量個數(shù)有利于模型的構(gòu)建(回歸模型樣本量對自變量個數(shù)有限制)。
但只是探討探討影響因素而非構(gòu)建預(yù)測模型時,逐步回歸法有什么優(yōu)勢?


(1)有人說,逐步回歸法可以減少冗余的自變量

其實,這不是好的解決辦法。冗余的自變量有兩套解決方案。

第一,我們構(gòu)建回歸時候,在考慮哪些可能的影響因素時,就應(yīng)該慎重考慮,不是所有阿狗阿貓都作為候選自變量開展回歸分析,與結(jié)局變量“拉郎配”。
只有與結(jié)局變量可能存在著因果關(guān)系的變量,才推薦開展回歸分析。這一點,是需要從專業(yè)上去考慮的。
第二,在統(tǒng)計分析的時候,若自變量個數(shù)很多,在單因素分析時就卡關(guān),不隨便納入自變量進入最終的多因素回歸模型。一般單因素分析P值較小者納入回歸模型。

(2)逐步回歸法可以把沒有統(tǒng)計學(xué)意義的自變量淘汰出去,它們不應(yīng)該留在模型中
這種理解是不對的!多因素回歸可以允許P值大于0.05的自變量留在模型并報告出來嗎?當(dāng)然可以。而且也推薦呈現(xiàn)在最后報告中,以展現(xiàn)哪些有統(tǒng)計學(xué)意義,哪些沒有統(tǒng)計學(xué)意義。

(3)逐步回歸法效果更好

不見得。逐步回歸法優(yōu)點在于把對因變量影響較小的都淘汰掉,自變量個數(shù)減少了,所以留在模型的自變量效應(yīng)會增強!看起來變美好了。

這個前提是你自變量實在太多了。但是,這種情況是不多見的。如果回歸分析放入太多的自變量,那么逐步回歸法也挽救不了你。

(4)有人說,逐步回歸法可以處理多重共線性
很多時候,由于自變量存在著高度相關(guān)。這個時候,連教科書都推薦試試逐步回歸法呀!

這種做法其實很要命!這是一種完全無視數(shù)據(jù)特點,強行胡亂進行自變量篩選的一種方法。

為什么有多重共線性?多重共線性往往由于變量之間存在著關(guān)聯(lián)性,這種關(guān)聯(lián)性有幾種情況:
第一,這個變量是混雜變量,由于混雜變量與自變量相關(guān),所以造成部分共線性
第二,這個變量是中介變量,中介變量也會造成自變量相關(guān)第三,變量是同個東西。比如年齡這一定量變量和根據(jù)年齡進行分組產(chǎn)生年齡的等級變量,那么原先的年齡定量數(shù)據(jù)和等級變量的年齡就是高度相關(guān),如果它們一同納入模型,就會造成共線性第四,一個事物的兩個屬性,比如身高與坐高,相關(guān)高度相關(guān),如果,如果他們一同納入模型,就會造成共線性

實際上,除了第一點之外,我們在處理多重共線性時,典型的方法是排除造成多重共線性的變量。比如身高坐高在回歸分析應(yīng)該2選1,定量年齡和分類年齡應(yīng)該2選1,中介變量不能納入模型。


詳情請點擊下方:

https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650404618&idx=4&sn=56c3315b1ca3a60c9ee56afae1f92103&chksm=83518aa2b42603b4642e9600e1daaf151e7cbdc866e4c683eeebd45a4c03ff61dfff2bb90203&token=1579182731&lang=zh_CN#rd

vx關(guān)注“醫(yī)學(xué)論文與統(tǒng)計分析”,獲取更多精彩內(nèi)容!???

2023年統(tǒng)計服務(wù)?

2023年,我們將開展從科研設(shè)計、數(shù)據(jù)分析、統(tǒng)計學(xué)報告等醫(yī)學(xué)科研研究方法咨詢與服務(wù)多項服務(wù),若您有課題經(jīng)費可以支持,歡迎您提前和我們聯(lián)系,2022底前采用預(yù)付方式與我們開展合作。?

2023年統(tǒng)計服務(wù)開啟!歡迎提前洽談數(shù)據(jù)分析、科研合作服務(wù)

統(tǒng)計咨詢:為什么我不建議隨便用逐步回歸法構(gòu)建回歸模型?的評論 (共 條)

分享到微博請遵守國家法律
武山县| 上杭县| 嘉定区| 健康| 黄冈市| 炎陵县| 关岭| 新巴尔虎右旗| 渝北区| 湾仔区| 綦江县| 卓资县| 祁东县| 瑞金市| 平潭县| 莱芜市| 沙坪坝区| 上虞市| 泰顺县| 凤台县| 体育| 江都市| 乾安县| 新郑市| 枣庄市| 克山县| 密云县| 本溪市| 常熟市| 黎城县| 涞水县| 陆河县| 城口县| 清涧县| 天柱县| 瓦房店市| 盈江县| 保德县| 应用必备| 云林县| 汉川市|