如何批量開展單因素線性回歸?

2023年鄭老師多門科研統(tǒng)計課程:多次直播,含孟德爾隨機化方法

線性回歸是一種常用的統(tǒng)計分析方法,用于建立自變量和因變量之間的線性關(guān)系模型。當知道兩個變量間存在相關(guān)關(guān)系時,我們時常想進一步去探討是否可以通過其中一個變量的數(shù)值定量的去預(yù)測另外一個變量的數(shù)值。
經(jīng)典案例:父親身高與兒子身高存在相關(guān)關(guān)系,是否可以通過父親身高預(yù)測兒子的身高?
這類問題在統(tǒng)計學(xué)上常采用線性回歸的方法來解決。
對于統(tǒng)計小白來說,會想到用SPSS開展線性回歸分析,畢竟SPSS工具非常簡單,統(tǒng)計分析操作過程明晰,可謂是傻瓜式操作。但是做單因素線性回歸時只能一個一個來,結(jié)果顯示又過于僵硬,回頭分析報告需要自己一點一點填入統(tǒng)計表,雖然簡單但工作量太大。
如果可以批量開展單因素線性回歸,還能一鍵生成三線表就再好不過了!那今天,就為諸位介紹兩種方式來實現(xiàn)它!分別是風(fēng)暴統(tǒng)計和R語言軟件!

本文主要內(nèi)容包括:
1.實操案例介紹
2.風(fēng)暴統(tǒng)計復(fù)現(xiàn)批量單因素線性回歸
3.R語言軟件復(fù)現(xiàn)批量單因素線性回歸
1、實操數(shù)據(jù)集介紹
我們使用R語言MASS包自帶數(shù)據(jù)集birthwt作為實操數(shù)據(jù)集。這是一份于1986年在在馬薩諸塞州收集的與嬰兒出生體重低相關(guān)的危險因素的數(shù)據(jù)。以定量數(shù)據(jù)出生體重(bwt)作為結(jié)局變量,探討下列因素對出生體重的影響??赡艿挠绊懸蛩厝缦拢?/p>
下面將結(jié)合本數(shù)據(jù)分別通過風(fēng)暴統(tǒng)計智能在線免費平臺與R語言軟件來進行批量單因素回歸分析復(fù)現(xiàn),方便大家對兩種方法的特點有更加直觀的認識!
2、風(fēng)暴統(tǒng)計復(fù)現(xiàn)批量單因素線性回歸
第一步:輸入網(wǎng)址,打開“風(fēng)暴智能統(tǒng)計”——“線性回歸分析”


第二步:導(dǎo)入整理好的數(shù)據(jù),目前支持10M以內(nèi)的csv格式數(shù)據(jù)

第三步:點擊“快速線性回歸分析”——選擇因變量和自變量,右側(cè)直接顯示批量單因素回歸法的結(jié)果

第四步:導(dǎo)出統(tǒng)計分析報告——一鍵導(dǎo)出word版三線表結(jié)果

風(fēng)暴統(tǒng)計結(jié)果展示如下,直接生成word版三線表,高效快速,結(jié)果還比較美觀!

3、R語言軟件復(fù)現(xiàn)批量單因素線性回歸
第一步:安裝并加載R包
install.packages("autoReg")
library(autoReg)
autoReg包,一款功能十分強大的R包,加gaze函數(shù)即可快捷完成基線表的制作,還可以直接一行代碼輸出單因素+多因素回歸分析(支持線性模型、廣義線性模型和比例風(fēng)險模型)的表格。
第二步:導(dǎo)入整理好的數(shù)據(jù)
setwd("D:/R")#設(shè)置工作空間,將要導(dǎo)入的csv格式數(shù)據(jù)放在工作空間文件夾中
BWT<-read.csv("BWT.csv")

第三步:autoReg包做批量單因素線性回歸分析
#函數(shù)表達式:
#linfit<-lm(y~x1+x2+x3+x4+x5……,data=數(shù)據(jù)集名)
#linreg<-autoReg(linfit,uni=TRUE,multi=TRUE,threshold=0.05)
#uni為T指輸出單因素模型結(jié)果,multi為T輸出多因素模型結(jié)果,threshold納入多因素回歸模型的條件
linfit<-lm(bwt~age+lwt+race+smoke+ptd+ht+ui+ftv,data = BWT)
linreg<-autoReg(linfit,uni=T,multi=F,threshold=1)
linreg#展示結(jié)果

從以上結(jié)果對比可以看出,風(fēng)暴統(tǒng)計平臺與R語言單因素線性回歸結(jié)果完全一致,并且風(fēng)暴統(tǒng)計平臺操作更簡單,且p值單獨分列,結(jié)果更加的清晰明了!
風(fēng)暴統(tǒng)計平臺的分析結(jié)果十分規(guī)范可靠,這也是由于平臺的構(gòu)建依托于R代碼進行分析。同時操作過程也十分的簡便,相較于R語言的使用門檻那真的是低太多了。結(jié)果直接一鍵輸出word三線表,方便又快捷,大家進行統(tǒng)計分析時不妨一試!