R語言配對檢驗(yàn)分析案例
原文http://tecdat.cn/?p=3424
?
什么是檢驗(yàn)對?
檢驗(yàn)對的形式?(x1,x2)(X1,X2)?出現(xiàn)在兩種情況中:
對同一實(shí)體執(zhí)行兩次測量。例如,一項(xiàng)評估新型胰島素療效的臨床研究將為每位患者測量兩次血糖水平:之前(X1X1)服藥后(X2X2)。
對不同的實(shí)體進(jìn)行測量。但是,實(shí)體根據(jù)其特征進(jìn)行匹配。例如,為了測試藥物的功效,您可能希望根據(jù)體重,年齡或其他特征配對研究參與者,以控制這些混雜因素。
在第一種情況下,配對是數(shù)據(jù)生成過程的自然結(jié)果。在第二種情況下,配對由研究設(shè)計(jì)強(qiáng)制執(zhí)行。
為什么依賴測量有用?
使用配對測量,可以控制影響測量結(jié)果的混雜因素。因此,匹配研究設(shè)計(jì)通常比涉及獨(dú)立組的設(shè)計(jì)更強(qiáng)大。
睡眠數(shù)據(jù)集
讓我們考慮睡眠數(shù)據(jù)集,舉例說明:
data(sleep)
print(sleep)
## ? ?extra group ID
## 1 ? ?0.7 ? ? 1 ?1
## 2 ? -1.6 ? ? 1 ?2
## 3 ? -0.2 ? ? 1 ?3
## 4 ? -1.2 ? ? 1 ?4
## 5 ? -0.1 ? ? 1 ?5
## 6 ? ?3.4 ? ? 1 ?6
## 7 ? ?3.7 ? ? 1 ?7
## 8 ? ?0.8 ? ? 1 ?8
## 9 ? ?0.0 ? ? 1 ?9
## 10 ? 2.0 ? ? 1 10
## 11 ? 1.9 ? ? 2 ?1
## 12 ? 0.8 ? ? 2 ?2
## 13 ? 1.1 ? ? 2 ?3
## 14 ? 0.1 ? ? 2 ?4
## 15 ?-0.1 ? ? 2 ?5
## 16 ? 4.4 ? ? 2 ?6
## 17 ? 5.5 ? ? 2 ?7
## 18 ? 1.6 ? ? 2 ?8
## 19 ? 4.6 ? ? 2 ?9
## 20 ? 3.4 ? ? 2 10
extra表示與基線測量相比睡眠中的增加/減少(正/負(fù)值),組表示藥物,ID表示患者ID。為了更清楚,我將組重命名為藥物:
調(diào)查睡眠數(shù)據(jù)集
重要的是要注意每個人都是不同的。因此,相同藥物的功效可能因人而異。讓我們看看這個數(shù)據(jù)集中是否也是這種情況:

實(shí)際上,個體研究對象的額外睡眠時(shí)間分布似乎是雙峰的。大約一半的受試者表現(xiàn)出兩種藥物的睡眠持續(xù)時(shí)間大幅增加,而另一半受試者幾乎沒有益處甚至患有藥物。使用配對測試,可以校正這些患者間差異,而對于假設(shè)測量是獨(dú)立的測試,這是不可能的。
比較不成對和配對測試
現(xiàn)在讓我們比較不成對測試和配對測試對睡眠數(shù)據(jù)集的執(zhí)行情況。
Wilcoxon秩和檢驗(yàn)
如果我們在測量中使用未配對的Wilcoxon秩和檢驗(yàn)(Mann-Whitney U檢驗(yàn)),則該檢驗(yàn)將產(chǎn)生以下藥物順序以確定顯著性:
## ?[1] 1 1 1 1 2 1 2 1 1 2 2 2 2 1 1 2 1 2 2 2
## Levels: 1 2
我們可以看到,雖然代表性不足,但藥物1在最高級別中出現(xiàn)了好幾次。這是因?yàn)?,對于兩種藥物反應(yīng)良好的患者,藥物1也運(yùn)作良好。由于依賴藥物的額外睡眠時(shí)間沒有明顯的分離,因此測試在5%的水平上不會顯著:
## [1] 0.06932758
威爾科克森簽下了排名測試
考慮成對的測量值更有意義,因?yàn)闇y試結(jié)果不受個體受試者的藥物敏感性的影響。我們可以看到,當(dāng)我們計(jì)算患者內(nèi)額外睡眠差異時(shí),用于未配對Wilcoxon簽名等級測試的度量:
## ?[1] -1.2 -2.4 -1.3 -1.3 ?0.0 -1.0 -1.8 -0.8 -4.6 -1.4
非陽性差異清楚地表明藥物1在所有研究受試者中都不如藥物2。由于Wilcoxon簽名等級測試基于這些差異,因此發(fā)現(xiàn)兩種藥物在顯著性水平為5%時(shí)存在顯著差異:
# use a paired test:
w.unpaired <- wilcox.test(x, y, paired = TRUE)
print(w.unpaired$p.value)
## [1] 0.009090698
結(jié)論
這個例子說明了為什么分組研究設(shè)計(jì)優(yōu)于測量獨(dú)立的研究設(shè)計(jì)。當(dāng)然,僅在使用考慮配對檢驗(yàn)的測試來評估數(shù)據(jù)的情況下才是這種情況。否則,統(tǒng)計(jì)功率會丟失,并且實(shí)際上重要的結(jié)果可能被錯誤地視為無關(guān)緊要。
?