如何開展logistic逐步回歸法?
Logistic回歸在醫(yī)學(xué)科研、特別是觀察性研究領(lǐng)域,無論是現(xiàn)況調(diào)查、病例對(duì)照研究、還是隊(duì)列研究中都是大家經(jīng)常用到的統(tǒng)計(jì)方法,而在影響因素研究篩選自變量時(shí),大家習(xí)慣性用的比較多的還是先單后多,P<0.05納入多因素研究,很少用逐步回歸法,有些同學(xué)可能聽過但是了解也不多,這里先簡(jiǎn)單介紹一下。

那么什么時(shí)候推薦用逐步回歸呢?有以下2種情況,可以考慮使用:
①探索性研究、探討多個(gè)影響因素時(shí),候選的影響因素實(shí)在太多(單因素分析后P值<0.05者,仍然超過10個(gè)),或者樣本量不大。
②構(gòu)建預(yù)測(cè)模型時(shí)候,就放心大膽的用。其他場(chǎng)景,一般不建議用逐步回歸法。
逐步回歸法的原理聽上去很復(fù)雜,但是用R語(yǔ)言幾行代碼也可以搞定,只是R語(yǔ)言需要一定的代碼基礎(chǔ),一時(shí)半會(huì)兒也無法學(xué)會(huì),因此,這里結(jié)合實(shí)操案例為大家介紹一個(gè)智能在線免費(fèi)統(tǒng)計(jì)分析平臺(tái)——風(fēng)暴統(tǒng)計(jì)。

一、實(shí)操數(shù)據(jù)介紹
這里我們使用的是R語(yǔ)言自帶數(shù)據(jù)集MASS中的birthwt,birthwt是一份與嬰兒出生體重低相關(guān)的危險(xiǎn)因素?cái)?shù)據(jù),其中包含的變量見下表,根據(jù)研究設(shè)計(jì),以“l(fā)ow”作為結(jié)局變量。

二、風(fēng)暴統(tǒng)計(jì)智能在線免費(fèi)平臺(tái)復(fù)現(xiàn)
(1)進(jìn)入風(fēng)暴統(tǒng)計(jì)網(wǎng)站的“風(fēng)暴智能統(tǒng)計(jì)”模塊,點(diǎn)擊“l(fā)ogistic回歸分析”

(2)導(dǎo)入數(shù)據(jù),目前支持10M以內(nèi)的csv格式。數(shù)據(jù)導(dǎo)入前如需進(jìn)行預(yù)處理的(如:定量數(shù)據(jù)轉(zhuǎn)分類數(shù)據(jù)、多分類轉(zhuǎn)二分類、打標(biāo)簽等),推薦用SPSS進(jìn)行操作,具體詳見下方文章:
如何結(jié)合SPSS與在線統(tǒng)計(jì)分析平臺(tái)來撰寫論文?

(4)指定因變量與自變量的變量類型

(5)指定logistic回歸方式
這里我們以P值0.05為界,選用雙向逐步回歸法,右側(cè)直接得出三線表結(jié)果!

(6)導(dǎo)出word版三線表結(jié)果

三、R語(yǔ)言軟件復(fù)現(xiàn)
這里采用autoReg包,autoReg包是一款功能十分強(qiáng)大的R包,不僅可以快捷完成基線表的制作,還可以直接一行代碼輸出回歸分析(支持線性模型、廣義線性模型和比例風(fēng)險(xiǎn)模型)的表格。
(1)logistic回歸模型構(gòu)建
使用glm() 函數(shù)構(gòu)建回歸模型,glm(y~x1+x2+x3+x4+x......,data=數(shù)據(jù)集名,family="binomial"),指定因變量與自變量,設(shè)置數(shù)據(jù)集名。
logfit<-glm(low ~ age + lwt + race + smoke + ptd + ht +?ui +?ftv,data=bwt,family = "binomial")
summary(logfit)
此處參數(shù)family規(guī)定了回歸模型的類型:family="binomial"指適用于二元離散因變量(binary)。
(2)逐步回歸法
logreg4<-autoReg(logfit,uni=TRUE,threshold=0.05, final=T) ??#final=T逐步回歸
logreg4
logtable4<-myft(logreg4)

四、總結(jié)
通過對(duì)比,風(fēng)暴統(tǒng)計(jì)與R語(yǔ)言先單后多的分析結(jié)果完全一致,風(fēng)暴統(tǒng)計(jì)對(duì)于P值還有單獨(dú)成列,結(jié)果更加清晰直觀!這也是由于平臺(tái)的構(gòu)建依托于R代碼進(jìn)行分析。同時(shí)結(jié)果輸出更加快捷,迅速,大家進(jìn)行統(tǒng)計(jì)分析時(shí)不妨試一試!

