如何自動開展logistic先單后多回歸分析?
在醫(yī)學科研、特別是觀察性研究領域,無論是現(xiàn)況調查、病例對照研究、還是隊列研究,經(jīng)常遇到二分類指標,大家也都知道使用logistic開展回歸分析,使用先單后多法來篩選自變量。
實際中,許多人習慣性使用SPSS進行回歸分析,但是SPSS無法使單因素結果與多因素結果在同一張表格中,手動繪制三線表既費時又費力。而R語言雖然可以解決以上難點但具有一定的門檻,因此,這里結合一篇文獻與實操案例為大家介紹一個智能在線免費統(tǒng)計分析平臺——風暴統(tǒng)計。

一、實操數(shù)據(jù)介紹
這里我們使用的是R語言自帶數(shù)據(jù)集MASS中的birthwt,birthwt是一份與嬰兒出生體重低相關的危險因素數(shù)據(jù),其中包含的變量見下表,根據(jù)研究設計,以“l(fā)ow”作為結局變量。

二、風暴統(tǒng)計智能在線免費平臺復現(xiàn)
(1)進入風暴統(tǒng)計網(wǎng)站的“風暴智能統(tǒng)計”模塊,點擊“l(fā)ogistic回歸分析”

(2)導入數(shù)據(jù),目前支持10M以內的csv格式。數(shù)據(jù)導入前如需進行預處理的(如:定量數(shù)據(jù)轉分類數(shù)據(jù)、多分類轉二分類、打標簽等),推薦用SPSS進行操作,具體詳見下方文章:

(3)指定因變量與自變量的變量類型

(4)指定logistic回歸方式
這里選用先單后多的篩選方式,這個方法比較傳統(tǒng)也是大家習慣性用的比較多的,P值的限定大家可以根據(jù)自己的研究設計,選擇0.05、0.1、0.2。

(5)導出word版三線表結果
風暴統(tǒng)計結果結果展示如下,直接生成word版三線表,高效快速!

三、R語言軟件復現(xiàn)
這里采用autoReg包,autoReg包是一款功能十分強大的R包,不僅可以快捷完成基線表的制作,還可以直接一行代碼輸出回歸分析(支持線性模型、廣義線性模型和比例風險模型)的表格。
(1)logistic回歸模型構建
使用glm() 函數(shù)構建回歸模型,glm(y~x1+x2+x3+x4+x......,data=數(shù)據(jù)集名,family="binomial"),指定因變量與自變量,設置數(shù)據(jù)集名。
logfit<-glm(low ~ age + lwt + race + smoke + ptd + ht +?ui +?ftv,data=bwt,family = "binomial")
summary(logfit)
此處參數(shù)family規(guī)定了回歸模型的類型:family="binomial"指適用于二元離散因變量(binary)。
(2)先單后多
logreg3<-autoReg(logfit,uni=TRUE,threshold=0.05)
logreg3
logtable3<-myft(logreg3)

四、總結
通過對比,風暴統(tǒng)計與R語言先單后多的分析結果完全一致,風暴統(tǒng)計對于P值還有單獨成列,結果更加清晰直觀,大家也可以來試一試哦!

