線性回歸中一次性實(shí)現(xiàn)所有自變量的單因素分析

在之前的21期文章中,我們手把手講解了如何在JMP中進(jìn)行數(shù)據(jù)清洗、開展基礎(chǔ)統(tǒng)計(jì)分析。本文以及后面的幾篇文章中,我們將分別對(duì)線性回歸的實(shí)現(xiàn)過(guò)程逐一展開介紹。
在進(jìn)行線性回歸多因素分析前,往往需要先進(jìn)行單因素分析。但是,目前常用的大多數(shù)軟件操作單因素分析比較繁瑣,需要不斷替換自變量來(lái)重復(fù)操作,才能進(jìn)行多個(gè)自變量的單因素分析。然而,在JMP軟件中可以一次性實(shí)現(xiàn)全部自變量的單因素分析。今天的文章將從如何實(shí)現(xiàn)這一過(guò)程說(shuō)起。

為了幫助更多的臨床醫(yī)師學(xué)習(xí)如何運(yùn)用JMP高效地開展數(shù)據(jù)分析,提高日常工作和發(fā)表論文的效率,2020年8月起,JMP資深用戶、JMP特約專欄作者、資深統(tǒng)計(jì)學(xué)家馮國(guó)雙博士及其團(tuán)隊(duì)將在JMP數(shù)據(jù)分析平臺(tái)為大家分享一系列統(tǒng)計(jì)及數(shù)據(jù)分析、JMP實(shí)戰(zhàn)操作、JMP分析報(bào)表解讀等干貨內(nèi)容,每期一個(gè)經(jīng)典話題,幫助大家掌握一個(gè)新技能。值得注意的是,這些話題并非僅針對(duì)臨床醫(yī)師,對(duì)所有運(yùn)用JMP軟件開展數(shù)據(jù)分析的小伙伴都適用。本文為此系列文章的第22期。
01 為什么要做線性回歸?
相比前面介紹的僅含一個(gè)組別變量的單因素分析,多因素分析在實(shí)際中更為常見,因?yàn)榻^大多數(shù)的結(jié)局都不止受一個(gè)因素影響。如比較兩種不同藥物治療糖尿病的療效,即使兩組間療效有差異,也未必能歸因到藥物因素,因?yàn)橄馚MI、血壓、飲食等諸多因素也會(huì)同時(shí)影響到藥物治療的效果,如果這些因素在兩組間不均衡,就會(huì)影響到藥物的評(píng)價(jià)效果。因此實(shí)際中我們經(jīng)常要用到多因素分析。我們通常說(shuō)的“校正”年齡、性別等因素的影響,或吸煙是肺癌的“獨(dú)立預(yù)后因素”,這些其實(shí)都是在說(shuō)多因素分析。
線性回歸常用于定量結(jié)局的多因素分析,主要用于描述1個(gè)或多個(gè)自變量與定量結(jié)局的線性關(guān)系。當(dāng)我們想針對(duì)某定量結(jié)局進(jìn)行危險(xiǎn)因素探索,通常首先會(huì)考慮線性回歸,如果線性回歸不合適,再考慮其它替代方法。
02 線性回歸的單因素分析
所謂單因素分析,也就是每次做回歸都先放入1個(gè)自變量,觀察每一自變量與因變量的關(guān)系。
目前很多統(tǒng)計(jì)軟件做單因素分析時(shí),只能放入一個(gè)自變量,然后做出結(jié)果;如果要看另一個(gè)自變量的效應(yīng),則需要返回重新在放入。如果有20個(gè)自變量,需要來(lái)來(lái)回回反復(fù)做20次相同的工作。這一過(guò)程非常繁瑣,也沒(méi)什么技術(shù)含量。而JMP軟件則提供了一次性實(shí)現(xiàn)所以自變量的單因素分析的工具。
以圖1的數(shù)據(jù)為例,探索軀體健康評(píng)分的可能影響因素。

在JMP中依次點(diǎn)擊“分析”菜單→“以X擬合Y”(圖2),在彈出的對(duì)話框中將軀體健康評(píng)分導(dǎo)入“Y,響應(yīng)”,將全部自變量導(dǎo)入“X,因子”(圖3)。


默認(rèn)輸出結(jié)果如圖4所示(僅展示了3個(gè)自變量,其余省略), 頁(yè)面上僅呈現(xiàn)每個(gè)自變量與因變量的散點(diǎn)圖。

如果要查看各個(gè)自變量的單因素分析的檢驗(yàn)結(jié)果,則需在JMP中進(jìn)行后續(xù)的一些操作。需要注意的是,連續(xù)變量和分類變量的操作步驟不同。
對(duì)于連續(xù)變量,以年齡為例,點(diǎn)擊結(jié)果界面中“二元擬合”左側(cè)的紅色向下箭頭→選擇“擬合線”(圖5)。

輸出結(jié)果如圖6所示,從圖中可以看出,年齡與軀體健康評(píng)分呈負(fù)向線性關(guān)系。從統(tǒng)計(jì)學(xué)檢驗(yàn)結(jié)果來(lái)看,年齡與軀體健康評(píng)分線性的關(guān)系在0.05的檢驗(yàn)水準(zhǔn)上具有統(tǒng)計(jì)學(xué)意義(P=0.0275)。

對(duì)于分類變量,以飲酒為例,點(diǎn)擊“……單因子分析”左側(cè)的紅色向下箭頭→選擇“均值/方差分析/合并的t”(圖7)。

輸出結(jié)果如圖8所示,結(jié)果中同時(shí)給出了t檢驗(yàn)和單因素方差分析的結(jié)果,兩者結(jié)果一致。結(jié)果顯示飲酒與軀體健康評(píng)分的關(guān)系不具有統(tǒng)計(jì)學(xué)意義(P=0.8871)。

大家看到這里,可能會(huì)想到,如果自變量很多的情況下,每個(gè)自變量都要操作“擬合線”或“均值/方差分析/合并的t”,過(guò)程會(huì)很繁瑣。JMP中有一種快捷方式用于解決此問(wèn)題,能夠非??焖俚仫@示出全部自變量的統(tǒng)計(jì)檢驗(yàn)結(jié)果。
對(duì)于連續(xù)變量,先按ctrl鍵,然后點(diǎn)擊任意一項(xiàng)自變量其“二元擬合”左側(cè)的紅色向下箭頭→選擇“擬合線”,可實(shí)現(xiàn)所有連續(xù)變量的單因素分析結(jié)果的輸出。
對(duì)于分類變量,同樣是先按ctrl鍵,然后點(diǎn)擊任意一項(xiàng)分類變量左側(cè)的紅色向下箭頭,選擇“均值/方差分析/合并的t”,可實(shí)現(xiàn)所有分類變量的單因素分析結(jié)果的輸出。
以上就是今天分享的基于JMP一次性實(shí)現(xiàn)全部自變量的單因素分析。在下期文章中,我們將介紹如何在JMP中開展線性回歸的多因素分析。
如果想要在JMP中親自動(dòng)手實(shí)踐的話,可下載最新的JMP 16免費(fèi)試用:
https://www.jmp.com/zh_cn/download-jmp-free-trial.html?utm_campaign=td7013Z000002DxWTQA0&utm_source=bilibili&utm_medium=social
或掃描二維碼,下載試用:
