樣本均數(shù)多重比較
一、案例介紹
由單因素方差分析案例中,為研究郁金對(duì)低張性缺氧小鼠存活時(shí)間的影響,將36只小鼠隨機(jī)生成A、B以及 C 三組,每組12個(gè),雌雄各半,分別以10g/kg、20g/kg、40g/kg三種不同劑量的郁金灌胃,各組小鼠均同時(shí)置于放有鈉石灰的250ml密閉廣口瓶中,觀察并記錄小鼠存活時(shí)間。想要研究不同劑量的郁金下的小鼠的存活時(shí)間是否不同,經(jīng)過(guò)分析后發(fā)現(xiàn)模型是有顯著性差異,說(shuō)明對(duì)個(gè)總體均數(shù)不全相等,但是究竟是A、B、C三組總體均數(shù)全部不等,還是其中兩個(gè)總體均數(shù)不等,需要進(jìn)一步研究(案例數(shù)據(jù)來(lái)源于:顏虹, 徐勇勇. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)[J]. 人民衛(wèi)生出版社, 2015.)。
二、問(wèn)題分析
經(jīng)過(guò)單因素方差分析后發(fā)現(xiàn)模型是有顯著性差異,說(shuō)明對(duì)個(gè)總體均數(shù)不全相等,但是究竟是甲、乙、丙三組總體均數(shù)全部不等,還是其中兩個(gè)總體均數(shù)不等,需要進(jìn)一步對(duì)多個(gè)均數(shù)做兩兩比較,用多重比較方法。
三、軟件操作及結(jié)果解讀
(一) 數(shù)據(jù)導(dǎo)入
1.數(shù)據(jù)格式
首先將數(shù)據(jù)整理成正確的格式,一般X一列,Y為一例,并且分析的數(shù)據(jù)帶有數(shù)據(jù)標(biāo)簽的,需要另添加一個(gè)表格進(jìn)行說(shuō)明,數(shù)據(jù)格式如下:
2.導(dǎo)入數(shù)據(jù)
將整理好的數(shù)據(jù)上傳至SPSSAU系統(tǒng)內(nèi),如下:
上傳結(jié)果如下:
(二)事后多重比較分析
對(duì)于單因素方差分析過(guò)程,可以參考前面所發(fā)的文章,這里對(duì)于其相關(guān)過(guò)程不再贅述。
- 軟件操作
單因素方差分析后,進(jìn)行兩兩比較進(jìn)一步研究,分析路徑為點(diǎn)擊【通用方法】→【方差分析】然后進(jìn)行分析:
多重比較有很多種方法,一般根據(jù)他的發(fā)展所采用的概率分布和發(fā)展過(guò)程可以發(fā)現(xiàn),一般包括t檢驗(yàn)和q檢驗(yàn)衍生的方法,目前這兩種方法的應(yīng)用較多,另外還有一些基于F分布的方法,具體說(shuō)明如下:
(1)LSD方法
LSD是最早的多重比較方法,LSD與獨(dú)立樣本t檢驗(yàn)非常相近,主要差別在于LSD法在首先滿足F檢驗(yàn)達(dá)到顯著的基礎(chǔ)上,將F檢驗(yàn)的誤差均方作為合并方差,LSD法因其計(jì)算簡(jiǎn)單,檢驗(yàn)效能高,所以被廣泛應(yīng)用,有研究者模擬試驗(yàn)比較了不同的事后多重比較方法,發(fā)現(xiàn)在方差中F檢驗(yàn)顯著時(shí),LSD方法是檢驗(yàn)效率最高的多重比較方法,但是LSD法也存在明顯的不足,比如涉及過(guò)多的要比較均數(shù)對(duì),犯I型錯(cuò)誤的概率較高。其計(jì)算公式如下:
tα/2為t分布的臨界值,通過(guò)查t分布表得到,其自由度為n-k,n為樣本總數(shù),k為因素中不同水平的水平個(gè)數(shù);MSE為組內(nèi)方差;ni和nj分別為第i個(gè)樣本和j個(gè)樣本的樣本量。
4.根據(jù)顯著性水平α做作出決策,如果均值之差的絕對(duì)值大于LSD,則拒絕H0,否則不拒絕H0。
(2)Scheffe
Scheffe檢驗(yàn)設(shè)定所有可能線性組合,Scheffe檢驗(yàn)的臨界值是用組間自由度乘以F檢驗(yàn)的臨界值,該方法對(duì)于非均衡設(shè)計(jì)更有效,但是Scheffe計(jì)算相較其他方法更為復(fù)雜,計(jì)算公式如下:
(3)Bonferroni校正
Bonferroni不等式是指一個(gè)或多個(gè)時(shí)間發(fā)生的總概率不高于這些事件各自發(fā)生概率的加和。但一般認(rèn)為該方法過(guò)于保守(更難得到拒絕無(wú)效假設(shè)的結(jié)論),Bonferroni法適用于比較次數(shù)不是太多的多重比較(比較次數(shù)越多越保守)。計(jì)算公式如下:
(4)sidak
Sidak基本思路與Bonferroni法接近,一般sidak優(yōu)于Bonferroni法,它使用Bonferroni修正中的一個(gè)特例來(lái)估算所有假設(shè)測(cè)試之間存在的共同顯著水平。
(5)Tamhane T2(方差不齊)
如果方差不齊,但希望進(jìn)行多重比較則使用此方法,其使用前提是需要數(shù)據(jù)滿足正態(tài)性,但是不需要滿足方差齊性。
(6)SNK Q檢驗(yàn)
SNK法的基本目標(biāo)是把處理均數(shù)分成不同處理的子集。這些子集內(nèi)部都是同質(zhì)的,但是不同子集之間卻存在差異,因此SNK又被稱為分層檢驗(yàn),就是按照范圍的不同采用不同的檢驗(yàn)標(biāo)準(zhǔn)來(lái)判定顯著性。因?yàn)槠浣y(tǒng)計(jì)量為q,又稱為q檢驗(yàn)。其統(tǒng)計(jì)量的計(jì)算如下:
式中分子為任意兩個(gè)對(duì)比組A、B的樣本均數(shù)之差值;分母是差值的標(biāo)準(zhǔn)誤;式中n_A和n_B分別為A和B兩個(gè)樣本的例數(shù),MS_誤差為前述方差分析中算得的誤差均方。
(7)Duncan檢驗(yàn)
Duncan氏新復(fù)極差法,目前更多的統(tǒng)計(jì)學(xué)文獻(xiàn)不推薦使用該方法,原因在于Duncan多重比較檢驗(yàn)誤差率的推導(dǎo)是基于單調(diào)性條件的(單調(diào)上升或單調(diào)下降且沒(méi)有震蕩),這也是很多動(dòng)物試驗(yàn)結(jié)果應(yīng)用Duncan氏新復(fù)極差法比較多的原因。
3.進(jìn)行兩兩比較
本例子以SNK Q檢驗(yàn)進(jìn)行兩兩比較。結(jié)果如下:
方差分析表格:
SNK Q檢驗(yàn)如下:
1.平均值
A組和B組比較時(shí)平均值就分別是A組數(shù)據(jù)和B組數(shù)據(jù)的平均值。其余同理。
2.差值絕對(duì)值
(I)平均值-(J)平均值的絕對(duì)值=差值絕對(duì)值,比如|40.083-52.985|=12.875,其余以此類推。
3)K
Q檢驗(yàn)的界值不但要考慮自由度,還需要考慮秩次R的差別,這里用K進(jìn)行表示,K=|R_A-R_B|+1;而A組、B組C組的秩如下:
比如A組和B組:K=|1-2|+1=2;以此類推。
4)df
df為自由度,這里的自由度為誤差自由度,一共有3組數(shù)據(jù),每組12個(gè)樣本,所以總的自由度為12×3-1=25,自變量的自由度為3-1=3,所以誤差自由度為35-2=33;
5)5%和1%
根據(jù)K以及自由度進(jìn)行查看q檢驗(yàn)界值表確定p值。
6)se
Se為差值的標(biāo)準(zhǔn)誤,計(jì)算如下:
7)LSR值
LSR值=Q臨界值*se,比如2.887*1.665=4.792;以此類推;
四、結(jié)論
經(jīng)過(guò)單因素方差分析后發(fā)現(xiàn)模型是有顯著性差異,說(shuō)明對(duì)個(gè)總體均數(shù)不全相等,經(jīng)過(guò)事后多重比較的SNK Q檢驗(yàn)的方法發(fā)現(xiàn)A組和B組在0.01水平上呈現(xiàn)顯著性,說(shuō)明兩者具有差異,并且A組和C組,B組和C組都是在0.01水平上呈現(xiàn)顯著性,說(shuō)明三者之間兩兩比較均具有顯著性差異。
五、知識(shí)小貼士
1、如何做Dunnett法事后多重比較?
如果需要進(jìn)行Dunnett事后檢驗(yàn)法,可使用SPSSAU通用方法里面的非參數(shù)檢驗(yàn),并且選擇多重比較方法為Dunn’s t法即可。
2、提示‘?dāng)?shù)據(jù)質(zhì)量異?!绾谓鉀Q?
如果是X的某個(gè)組別下,Y的個(gè)數(shù)小于2個(gè),此時(shí)會(huì)出現(xiàn)異常情況。建議使用分類匯總進(jìn)行檢查,確認(rèn)此種異常情況后,使用篩選樣本功能處理后再次分析即可。