干貨 | 方差分析及兩兩比較的思路與實(shí)現(xiàn)

在之前的文章中,我們介紹了組間比較的基本操作,并在上期文章中詳細(xì)介紹了t檢驗(yàn)在JMP中的實(shí)現(xiàn)。t檢驗(yàn)是用于檢驗(yàn)兩組均值差異的統(tǒng)計(jì)方法,而本文要講的則是用于檢驗(yàn)多組均值差異的統(tǒng)計(jì)方法——方差分析。

為了幫助更多的臨床醫(yī)師學(xué)習(xí)如何運(yùn)用JMP高效地開展數(shù)據(jù)分析,提高日常工作和發(fā)表論文的效率,2020年8月起,JMP資深用戶、JMP特約專欄作者、資深統(tǒng)計(jì)學(xué)家馮國雙博士及其團(tuán)隊(duì)將在JMP數(shù)據(jù)分析平臺(tái)為大家分享一系列統(tǒng)計(jì)及數(shù)據(jù)分析、JMP實(shí)戰(zhàn)操作、JMP分析報(bào)表解讀等干貨內(nèi)容,每期一個(gè)經(jīng)典話題,幫助大家掌握一個(gè)新技能。值得注意的是,這些話題并非僅針對(duì)臨床醫(yī)師,對(duì)所有運(yùn)用JMP軟件開展數(shù)據(jù)分析的小伙伴都適用。本文為此系列文章的第13期。
在本文中,我們以圖1的數(shù)據(jù)為例進(jìn)行講解。

方差分析的基本思想是把全部觀察值的總變異分解成組間變異和誤差變異,然后將組間變異與隨機(jī)誤差進(jìn)行比較,從而判斷總體均數(shù)間的差別是否具有統(tǒng)計(jì)學(xué)意義。
方差分析是t檢驗(yàn)的更一般性的推廣,t檢驗(yàn)可以看做是方差分析的特例。
因此使用方差分析的前提條件與t檢驗(yàn)一致:
①各個(gè)樣本是相互獨(dú)立的;
②各組數(shù)據(jù)服從正態(tài)分布;
③各組間的方差相等,即方差齊。
這提示我們?cè)谶M(jìn)行方差分析前,需要進(jìn)行正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn),這兩種檢驗(yàn)方法我們已在《如何在JMP中實(shí)現(xiàn)正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn)?》文章中進(jìn)行了詳細(xì)介紹。
方差分析只能得出組間有差異的結(jié)論,然而具體哪幾組之間有差異,仍需要進(jìn)一步統(tǒng)計(jì)分析,這時(shí)就需要用到兩兩比較。
常見的兩兩比較方法有Bonferroni法、Tukey’ HSD法和Dunnett法。
Bonferroni法
Bonferroni法的思路為在進(jìn)行兩兩比較時(shí)調(diào)整檢驗(yàn)水準(zhǔn)。通常組間比較以0.05作為檢驗(yàn)水準(zhǔn),但在兩兩比較時(shí),每次比較就會(huì)有5%的概率發(fā)生I類錯(cuò)誤。
Bonferroni法的思路就是通過將0.05除以要比較的次數(shù),降低檢驗(yàn)水準(zhǔn),從而減少假陽性錯(cuò)誤。如4組兩兩比較共需比較6次,則兩兩比較的檢驗(yàn)水準(zhǔn)需調(diào)整為0.05/6=0.0083,即認(rèn)為p<0.0083才算有統(tǒng)計(jì)學(xué)差異。但是該方法在比較次數(shù)較多時(shí)不太適合使用,因?yàn)樾U蟮臋z驗(yàn)水準(zhǔn)會(huì)過小。
Tukey'HSD法
Tukey法是常用的兩兩比較方法,該方法曾經(jīng)只能用于各組例數(shù)相等的情形,后來提出了改進(jìn)的Tukey法,可用于各組例數(shù)不等的情形。JMP軟件提供的就是改進(jìn)的Tukey法,該方法可作為兩兩比較的首選方法。
Dunnett法
Dunnett t檢驗(yàn)專門用于比較1個(gè)對(duì)照組和多個(gè)試驗(yàn)組間的差異,試驗(yàn)組之間不做比較。
01??JMP中的方差分析
圖1數(shù)據(jù)中,擬比較不同心功能分級(jí)患者的軀體健康評(píng)分是否存在差異,心功能分級(jí)分為1-4四級(jí),因此這是一個(gè)4組間的比較,不能直接用t檢驗(yàn),而應(yīng)考慮多組比較的方法。
首先通過點(diǎn)選JMP菜單“分析→以X擬合Y”(圖2),進(jìn)入組間差異比較的界面。

本例中軀體健康評(píng)分為結(jié)果,心功能分級(jí)為分組,因此在對(duì)話框中將軀體健康評(píng)分放入“Y,響應(yīng)”,將心功能分級(jí)放入“X,因子”(圖3)。

進(jìn)入結(jié)果界面后,我們需要結(jié)合正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn)的結(jié)果選擇合適的統(tǒng)計(jì)方法。如何進(jìn)行上述兩種檢驗(yàn)可參考文章《如何在JMP中實(shí)現(xiàn)正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn)?》。
正態(tài)性檢驗(yàn)結(jié)果顯示各組數(shù)據(jù)均為正態(tài)分布。方差齊性檢驗(yàn)結(jié)果見圖4。多組數(shù)據(jù)的方差齊性檢驗(yàn)多用Bartlett檢驗(yàn)和Levene檢驗(yàn)。Bartlett檢驗(yàn)主要用于正態(tài)分布的數(shù)據(jù),Levene檢驗(yàn)多用于數(shù)據(jù)不滿足正態(tài)分布的情形。
本例中數(shù)據(jù)為正態(tài)分布,采用Bartlett檢驗(yàn)結(jié)果,結(jié)果顯示方差不齊(P=0.0224)。

數(shù)據(jù)為正態(tài)分布但不滿足方差齊性檢驗(yàn)時(shí)采用Welch方差分析(方法選擇可參考文章《一個(gè)神奇的JMP菜單,實(shí)現(xiàn)數(shù)據(jù)的所有組間比較》)。
Welch方差分析結(jié)果見方差齊性檢驗(yàn)結(jié)果的最后一部分(圖5)。結(jié)果顯示四組間軀體健康評(píng)分的差異有統(tǒng)計(jì)學(xué)意義(F=40.2951,P<0.0001)。

如果數(shù)據(jù)滿足正態(tài)性且方差齊,則可直接采用方差分析,盡管從條件來看,本例數(shù)據(jù)應(yīng)該用Welch檢驗(yàn),但作為示例,我們同時(shí)也介紹一下方差分析的結(jié)果如何輸出。點(diǎn)擊“心功能分級(jí)-軀體健康評(píng)分”單因子分析旁邊的紅色三角形按鈕,在下拉菜單中選擇“均值/方差分析”(圖6)。

輸出結(jié)果見圖7,方差分析結(jié)果表明四組的軀體健康評(píng)分差異有統(tǒng)計(jì)學(xué)意義(F=16.0080,P<0.0001)。

從上述分析結(jié)果可以看出,方差分析的F值與Welch檢驗(yàn)結(jié)果有一定的差異。因此對(duì)于連續(xù)變量的組間比較一定要綜合考慮其正態(tài)性和方差齊性。
02?JMP中的兩兩比較
如果總的方差分析結(jié)果顯示無統(tǒng)計(jì)學(xué)差異,提示各組間均無統(tǒng)計(jì)學(xué)差異,則無需做兩兩比較。
但如果總的組間比較結(jié)果顯示四組的差異有統(tǒng)計(jì)學(xué)意義,那么通常還需要進(jìn)行組間兩兩比較,以明確具體是哪兩組之間有差異。
JMP中正態(tài)性數(shù)據(jù)兩兩比較比較操作在比較均值選項(xiàng)中完成操作,由于我們要比較任意兩組之間的差異,可選擇Tukey法。
點(diǎn)擊“心功能分級(jí)-軀體健康評(píng)分”單因子分析旁邊的紅色三角形按鈕,在下拉菜單中選擇“比較均值→所有對(duì),Tukey HSD”,操作見圖8。

輸出結(jié)果見圖9,結(jié)果顯示除了心功能分級(jí)3和4間無差異,其它組之間都有統(tǒng)計(jì)學(xué)差異。本例分析結(jié)果表明,不同心功能分級(jí)人群的軀體健康評(píng)分差異有統(tǒng)計(jì)學(xué)意義(F=16.0080,P<0.0001),除了心功能分級(jí)3和4間無差異,其它心功能分級(jí)之間的差異都有統(tǒng)計(jì)學(xué)意義。

以上就是本期我們?yōu)榇蠹規(guī)淼母韶浄窒?。你也可以在JMP中動(dòng)手試試看??蓮?fù)制以下鏈接到瀏覽器可下載最新的JMP 16免費(fèi)試用:
https://www.jmp.com/zh_cn/download-jmp-free-trial.html?utm_campaign=td7013Z000002DxWTQA0&utm_source=bilibili&utm_medium=social