如何在JMP中實現(xiàn)正態(tài)性檢驗和方差齊性檢驗?

在上一篇文章《一個神奇的JMP菜單,實現(xiàn)數(shù)據(jù)的所有組間比較》,我們從總體思路上介紹了組間比較常用的方法以及JMP操作的基本特色。
本文以及后面的幾篇文章中,我們將分別對幾種常見的組間比較方法及其實現(xiàn)過程逐一展開介紹。
為了幫助更多的臨床醫(yī)師學習如何運用JMP高效地開展數(shù)據(jù)分析,提高日常工作和發(fā)表論文的效率,2020年8月起,JMP資深用戶、JMP特約專欄作者、資深統(tǒng)計學家馮國雙博士及其團隊將在JMP數(shù)據(jù)分析平臺為大家分享一系列統(tǒng)計及數(shù)據(jù)分析、JMP實戰(zhàn)操作、JMP分析報表解讀等干貨內(nèi)容,每期一個經(jīng)典話題,幫助大家掌握一個新技能。值得注意的是,這些話題并非僅針對臨床醫(yī)師,對所有運用JMP軟件開展數(shù)據(jù)分析的小伙伴都適用。本文為此系列文章的第11期。
今天的文章將從連續(xù)變量的組間比較說起。首先建議大家回顧一下下圖。

對于連續(xù)變量的組間比較,如果要選擇合理的分析方法,有幾個前提條件必須先考慮,即正態(tài)性和方差齊性。
01 什么是正態(tài)性和方差齊性?
眾所周知,常見的數(shù)據(jù)分布形態(tài)有正態(tài)分布、泊松分布、指數(shù)分布等,正態(tài)性檢驗指判斷總體是否服從正態(tài)分布的檢驗。方差齊性檢驗是對各組樣本間方差是否相同進行的檢驗。
在連續(xù)變量組間比較的實際應用中,很多臨床醫(yī)師常犯的錯誤就是不考慮數(shù)據(jù)是否正態(tài)或是否方差齊,而是直接使用t檢驗或方差分析對數(shù)據(jù)進行統(tǒng)計分析。
有的朋友甚至還有一些所謂的“證據(jù)支持”,比如:統(tǒng)計書上說了,樣本量大于30數(shù)據(jù)就是正態(tài)分布,我的樣本數(shù)是50,所以不用做正態(tài)性檢驗;或者說:別人的文章跟我當前分析的是同一個指標,他們用的就是t檢驗。事實上,統(tǒng)計書上從來沒有說過樣本例數(shù)多了就不用做正態(tài)性檢驗,而別人的研究更不足以作為你犯錯的依據(jù)。正確的做法是,一定要在選擇方法之前看一下你的數(shù)據(jù)分布到底是什么樣子。
本文的內(nèi)容就是介紹在選擇統(tǒng)計方法之前需要考慮的兩個重要條件:如何判斷數(shù)據(jù)是否滿足正態(tài)分布、如何判斷組間的方差是否相等。只有確定了這兩個條件,才能選擇合理的分析方法。
02 在JMP中實現(xiàn)正態(tài)性檢驗
接下來,我們來看一下如何在JMP中使用“分布”平臺實現(xiàn)正態(tài)性檢驗。
以圖1的數(shù)據(jù)為例,探索吸煙與不吸煙人群的BMI值是否存在差異,首先需對BMI值進行正態(tài)性檢驗,然后根據(jù)數(shù)據(jù)分布情況判斷應該使用t檢驗還是秩和檢驗。

需要注意的是,在進行組間比較時,需分組進行正態(tài)性檢驗,即分別檢驗吸煙與不吸煙兩組人群BMI的分布,而不是檢驗所有人BMI數(shù)值的分布情況。
接下來為大家講解如何進行具體操作,首先選擇“分析”→“分布”(圖2)。

因為我們要探索吸煙和不吸煙的兩組人群的BMI分布情況,因此BMI為結(jié)果,吸煙為分組。所以在對話框中將BMI放入“Y,列”;將吸煙放入“依據(jù)”(圖3)。輸出結(jié)果見圖4。


JMP中經(jīng)常會看到“依據(jù)”,它表示“分別”或“分層”的意思,例如將吸煙拖入依據(jù),表示分別對吸煙人群和不吸煙人群執(zhí)行操作。這與“分組”意思不同,分組表示組間比較,如比較吸煙人群和不吸煙人群的差異。在后續(xù)的文章中,我們還會對這一概念進行解釋。
如果對這種豎向放置的直方圖不習慣,想將直方圖橫過來,可在結(jié)果界面點擊“分布 吸煙=吸煙”左側(cè)的紅色三角形按鈕,在下拉菜單中選擇“堆疊”(圖5)。

輸出結(jié)果如圖6所示。這里分別給出吸煙與不吸煙兩組人群的BMI的各類統(tǒng)計量,包括均值、標準差、中位數(shù)、上下四分位數(shù)等等。

在“分布 吸煙=吸煙”的內(nèi)容下點擊“BMI”左側(cè)的紅色三角形按鈕,在下拉菜單中點擊“連續(xù)擬合”→“擬合正態(tài)”(圖7)。

正態(tài)擬合的結(jié)果見圖8。

點擊正態(tài)擬合左側(cè)的紅色三角形按鈕,在下拉菜單中點擊“擬合優(yōu)度”(圖9),便會顯示正態(tài)性檢驗結(jié)果。

正態(tài)性檢驗結(jié)果如圖10所示,p值等于0.9128,大于0.05,不能認為不滿足正態(tài)分布,即無法得出“數(shù)據(jù)不服從正態(tài)分布”這一結(jié)論,因此可將數(shù)據(jù)視為正態(tài)分布進行分析。

不吸煙人群BMI的正態(tài)性檢驗操作方式同上,結(jié)果見圖11,為非正態(tài)分布。

根據(jù)上面的正態(tài)性檢驗結(jié)果,我們可以確定應使用秩和檢驗進行組間比較。因為兩組數(shù)據(jù)中只要有任意一組數(shù)據(jù)為非正態(tài)分布,就需使用秩和檢驗進行組間比較。
03 在JMP中實現(xiàn)方差齊性檢驗
如果在進行組間比較時,發(fā)現(xiàn)兩組數(shù)據(jù)均為正態(tài)分布,此時并不意味著就可以直接進行t檢驗了,還需要進行方差齊性檢驗,以確定應該使用t檢驗還是校正的t檢驗(t’檢驗)。
方差齊性檢驗是對組間方差是否相同進行的檢驗。為什么要做方差齊性檢驗?因為在進行組間比較時,如果組間方差差別太大,將會掩蓋掉均值的差異,導致錯誤的結(jié)論。
方差齊性檢驗常用的方法有:F雙邊檢驗、Brown-Forsythe檢驗、Levene檢驗、Bartlett檢驗和O’Brien檢驗。其中F雙邊檢驗用于兩組數(shù)據(jù)的方差齊性檢驗;其它用于多組數(shù)據(jù)的方差齊性檢驗,實際中以Levene法和Bartlett法較為常用,但Bartlett法只能用于正態(tài)數(shù)據(jù),Levene法還可用于非正態(tài)數(shù)據(jù),應用范圍更廣一些。
以圖1數(shù)據(jù)為例,若分析不同呼吸困難程度的人軀體健康評分是否有差異,則首先進行正態(tài)性檢驗,若檢驗結(jié)果發(fā)現(xiàn)兩組數(shù)據(jù)均為正態(tài)分布,接下來則進行方差齊性檢驗。
方差齊性檢驗作為組間比較的重要步驟,其操作在JMP菜單“以X擬合Y”模塊中實現(xiàn)。在前一篇文章中我們已經(jīng)對組間比較的操作進行了簡單介紹。
選擇“分析”→“以X擬合Y”。本例中軀體健康評分為結(jié)果,呼吸困難程度為分組。所以在對話框中將軀體健康評分放入“Y,響應”,將呼吸困難程度放入“X,因子”,操作見圖12。

點擊“呼吸困難-軀體健康評分”單因子分析旁邊的紅色三角形按鈕,在下拉菜單中選擇“不等方差”(圖13)。

輸出結(jié)果見圖14,若方差齊性檢驗的p值大于0.05,可以認為方差齊(嚴格來說應該是沒有足夠證據(jù)認為組間方差不齊)。
本案例為兩組方差齊性的檢驗,可選擇任一檢驗結(jié)果(因為兩組是多組的特例),結(jié)果顯示兩組方差不齊(各檢驗結(jié)果均顯示P<0.05),則后續(xù)應采用校正的t檢驗(t’檢驗)。

以上就是今天分享的基于JMP的正態(tài)性檢驗和方差齊性檢驗的一些方法與注意事項。如果你也想體驗運用JMP輕松實現(xiàn)正態(tài)性檢驗和方差齊性檢驗,歡迎下載JMP免費試用,跟著文章練起來吧。在下期文章中,我們將介紹如何在JMP中開展t檢驗。
你可以復制以下鏈接到瀏覽器下載擁有完整功能的JMP30天免費試用:
https://www.jmp.com/zh_cn/download-jmp-free-trial.html?utm_campaign=td7013Z000002DxWTQA0&utm_source=bilibili&utm_medium=social