R語(yǔ)言檢驗(yàn)獨(dú)立性:卡方檢驗(yàn)(Chi-square test)和費(fèi)舍爾精確檢驗(yàn)分析案例報(bào)告
原文http://tecdat.cn/?p=3715?
統(tǒng)計(jì)測(cè)試最常見(jiàn)的領(lǐng)域之一是測(cè)試列聯(lián)表中的獨(dú)立性。在這篇文章中,我將展示如何計(jì)算列聯(lián)表,我將在列聯(lián)表中引入兩個(gè)流行的測(cè)試:卡方檢驗(yàn)和Fisher精確檢驗(yàn)。
什么是列聯(lián)表?
列聯(lián)表提供關(guān)于兩個(gè)分類變量的測(cè)量的整數(shù)計(jì)數(shù)。最簡(jiǎn)單的列聯(lián)表是一個(gè)2?×?22×2?頻率表,由兩個(gè)變量產(chǎn)生,每個(gè)變量有兩個(gè)級(jí)別:
組/觀察觀察1觀察2第1組?1?,1?1,1?1?,2?1,2第2組?2?,1?2,1?2?,2?2,2
給定這樣一個(gè)表格,問(wèn)題是第1組是否表現(xiàn)出與第2組相比的觀測(cè)頻率。這些組代表因變量,因?yàn)樗鼈円蕾囉谧宰兞康挠^察。請(qǐng)注意,列聯(lián)表必須是一種常見(jiàn)的誤解2?×?22×2;?它們可以具有任意數(shù)量的維度,具體取決于變量顯示的級(jí)別數(shù)。盡管如此,應(yīng)避免對(duì)具有多個(gè)維度的列聯(lián)表進(jìn)行統(tǒng)計(jì)檢驗(yàn),因?yàn)槌渌蛲?,解釋結(jié)果將具有挑戰(zhàn)性。
?數(shù)據(jù)集
要研究列聯(lián)表的測(cè)試,我們將使用warpbreaks數(shù)據(jù)集:
data(warpbreaks)
head(warpbreaks)
## ? breaks wool tension
## 1 ? ? 26 ? ?A ? ? ? L
## 2 ? ? 30 ? ?A ? ? ? L
## 3 ? ? 54 ? ?A ? ? ? L
## 4 ? ? 25 ? ?A ? ? ? L
## 5 ? ? 70 ? ?A ? ? ? L
## 6 ? ? 52 ? ?A ? ? ? L
這是一個(gè)包含來(lái)自紡織行業(yè)的三個(gè)變量的數(shù)據(jù)集:中斷描述了羊毛中斷的次數(shù)? 描述了經(jīng)過(guò)測(cè)試的羊毛類型?張力∈?{?L?,M,H}張力∈{大號(hào),中號(hào),H}給出了施加在螺紋上的張力(低,中或高)。數(shù)據(jù)集中的每一行表示單個(gè)織機(jī)的測(cè)量值。為了解釋不同織機(jī)的可變性,對(duì)羊毛和張力的每種組合進(jìn)行了9次測(cè)量,數(shù)據(jù)集總共包含9???2???3?=?549?2?3=54?觀察結(jié)果。
分析目標(biāo)
我們想確定一種類型的羊毛在不同程度的緊張情況下是否優(yōu)于另一種羊毛。為了研究我們是否可以找到一些差異的證據(jù),讓我們來(lái)看看數(shù)據(jù):
為了研究鏈斷裂數(shù)的差異,讓我們可視化數(shù)據(jù):

從圖中我們可以看出,總體而言,羊毛B與較少的斷裂相關(guān)聯(lián)。羊毛A似乎特別低劣,因?yàn)榈蛷埩Α?/p>
轉(zhuǎn)換為列聯(lián)表
為了獲得列聯(lián)表,我們首先需要總結(jié)兩種類型的羊毛和三種類型的張力的不同織機(jī)的斷裂。
## ? wool tension breaks
## 1 ? ?A ? ? ? L ? ?401
## 2 ? ?A ? ? ? M ? ?216
## 3 ? ?A ? ? ? H ? ?221
## 4 ? ?B ? ? ? L ? ?254
## 5 ? ?B ? ? ? M ? ?259
## 6 ? ?B ? ? ? H ? ?169
然后我們使用xtabs
(發(fā)音為交叉表)函數(shù)來(lái)生成列聯(lián)表:
## ? ? tension
## wool ? L ? M ? H
## ? ?A 401 216 221
## ? ?B 254 259 169
現(xiàn)在,df
我們有了應(yīng)用統(tǒng)計(jì)測(cè)試所需的結(jié)構(gòu)。
統(tǒng)計(jì)檢驗(yàn)
用于確定來(lái)自不同組的測(cè)量值是否獨(dú)立的兩種最常見(jiàn)的測(cè)試是卡方檢驗(yàn)(χ2χ2測(cè)試)和費(fèi)舍爾的精確測(cè)試。請(qǐng)注意,如果測(cè)量結(jié)果配對(duì),則應(yīng)使用McNemar測(cè)試(例如,可以識(shí)別單個(gè)織機(jī))。
皮爾遜的卡方檢驗(yàn)
該?χ2χ2test是一種非參數(shù)測(cè)試,可應(yīng)用于具有各種維度的列聯(lián)表。測(cè)試的名稱源自χ2χ2分布,即獨(dú)立標(biāo)準(zhǔn)正態(tài)變量的平方分布。這是測(cè)試統(tǒng)計(jì)的分布χ2χ2?測(cè)試??
## [1] 7.900708e-07
由于p值小于0.05,我們可以在5%顯著性水平上拒絕測(cè)試的零假設(shè)(斷裂的頻率獨(dú)立于羊毛)。根據(jù)df
一個(gè)人的條目,然后可以聲稱羊毛B比羊毛A明顯更好(相對(duì)于經(jīng)紗斷裂)。
調(diào)查Pearson殘差
另一種方法是考慮測(cè)試的卡方值。該chisq.test
函數(shù)提供卡方值的Pearson殘差(根) 。與由平方差異產(chǎn)生的卡方值相反,殘差不是平方的。因此,殘差反映了觀測(cè)值超過(guò)預(yù)期值(正值)或低于預(yù)期值(負(fù)值)的程度。在我們的數(shù)據(jù)集中,正值表示比預(yù)期更多的鏈斷裂,而負(fù)值表示更少的斷點(diǎn):
## ? ? tension
## wool ? ? ? ? ?L ? ? ? ? ?M ? ? ? ? ?H
## ? ?A ?2.0990516 -2.8348433 ?0.4082867
## ? ?B -2.3267672 ?3.1423813 -0.4525797
殘留物表明,與羊毛A相比,羊毛B的低張力和高張力斷裂比預(yù)期的要少。然而,對(duì)于中等張力,羊毛B比預(yù)期的斷裂更多。再次,我們發(fā)現(xiàn),整體羊毛B優(yōu)于羊毛A.殘留物的值也表明羊毛B對(duì)于低張力(殘差為2.1),高張力(0.41)和中等張力嚴(yán)重( - 2.8)。然而,殘留物有助于我們識(shí)別羊毛B的問(wèn)題:它對(duì)中等張力的表現(xiàn)不佳。這將如何促進(jìn)進(jìn)一步發(fā)展?為了獲得在所有張力水平下表現(xiàn)良好的羊毛,我們需要專注于改善羊毛B的中等張力。為此,我們可以考慮使羊毛A在中等張力下表現(xiàn)更好的特性。
費(fèi)舍爾的確切測(cè)試
Fisher的精確測(cè)試是用于測(cè)試獨(dú)立性的非參數(shù)測(cè)試,通常僅用于測(cè)試?2?×?22×2列聯(lián)表。作為精確顯著性檢驗(yàn),F(xiàn)isher檢驗(yàn)符合所有假設(shè),在此基礎(chǔ)上定義檢驗(yàn)統(tǒng)計(jì)量的分布。實(shí)際上,這意味著錯(cuò)誤拒絕率等于測(cè)試的顯著性水平,對(duì)于近似測(cè)試,例如χ2χ2測(cè)試。簡(jiǎn)而言之,F(xiàn)isher的精確測(cè)試依賴于使用二項(xiàng)式系數(shù)根據(jù)超幾何分布計(jì)算p值,即通過(guò)
?
p?=?(n1?,1+?n1?,2?1?,1)(n2?,1+?n2?,2?2?,1)(n1?,1+?n1?,2+?n2?,1+?n2?,2?1?,1+?n2?,1)p=(?1,1+?1,2?1,1)(?2,1+?2,2?2,1)(?1,1+?1,2+?2,1+?2,2?1,1+?2,1)
?
由于計(jì)算的因子可能變得非常大,F(xiàn)isher精確檢驗(yàn)可能不適用于大樣本量。
請(qǐng)注意,無(wú)法指定測(cè)試的替代方法,df
因?yàn)閮?yōu)勢(shì)比(表示效果大?。﹥H定義為2?×?22×2?矩陣:
?
O?R?=?n1?,1?1?,2/?n2?,1?2?,2?[R=?1,1?1,2/?2,1?2,2
?
我們?nèi)匀豢梢詧?zhí)行Fisher精確檢驗(yàn)以獲得p值:
## [1] 8.162421e-07
得到的p值類似于從中獲得的p值?χ2χ2?測(cè)試并得出相同的結(jié)論:我們可以拒絕零假設(shè),即羊毛的類型與不同應(yīng)力水平下觀察到的斷裂次數(shù)無(wú)關(guān)。
轉(zhuǎn)換為2乘2矩陣
為了指定備選假設(shè)并獲得優(yōu)勢(shì)比,我們可以計(jì)算三者的測(cè)試?2?×?22×2可以構(gòu)造的矩陣df
:
由于替代方案設(shè)置得更大,這意味著我們正在進(jìn)行單尾測(cè)試,其中另一種假設(shè)是羊毛A與羊毛B的斷裂次數(shù)相關(guān)(即我們預(yù)期O?R?>?1?[R>1)。通過(guò)執(zhí)行測(cè)試2?×?22×2表格,我們也獲得了解釋性:我們現(xiàn)在可以區(qū)分羊毛不同的具體條件。然而,在解釋p值之前,我們需要糾正多個(gè)假設(shè)檢驗(yàn)。在這種情況下,我們進(jìn)行了三次測(cè)試。在這里,我們只需將0.05的初始顯著性水平調(diào)整為0.053=?0.01?6ˉˉˉ0.053=0.016ˉ根據(jù)Bonferroni方法。根據(jù)調(diào)整后的閾值,以下測(cè)試顯著:
## [1] "L vs others"
這一發(fā)現(xiàn)表明,如果應(yīng)力較輕,羊毛B僅顯著優(yōu)于羊毛A.?請(qǐng)注意,我們也可以采用構(gòu)建方法2?×?22×2?矩陣?χ2χ2測(cè)試。隨著χ2χ2?然而,測(cè)試并不是必要的,因?yàn)槲覀兊姆治龌跉埐睢?/p>
摘要:卡方對(duì)費(fèi)舍爾的精確檢驗(yàn)
以下是兩個(gè)測(cè)試的屬性摘要:
標(biāo)準(zhǔn)卡方檢驗(yàn)費(fèi)舍爾的確切測(cè)試最小樣本量大小準(zhǔn)確性近似精確列聯(lián)表任意維度通常為2x2解釋皮爾遜殘差優(yōu)勢(shì)比
通常,F(xiàn)isher精確檢驗(yàn)優(yōu)于卡方檢驗(yàn),因?yàn)樗且环N精確檢驗(yàn)。如果單個(gè)細(xì)胞的觀察結(jié)果很少(例如小于10),則應(yīng)特別避免卡方檢驗(yàn)。由于Fisher的精確檢驗(yàn)對(duì)于大樣本量和精確度可能在計(jì)算上是不可行的χ2χ2?測(cè)試隨著樣本數(shù)量的增加而增加?χ2χ2在這種情況下,測(cè)試是合適的替代品。另一個(gè)優(yōu)點(diǎn)了χ2χ2?測(cè)試是它更適合維數(shù)超過(guò)的列聯(lián)表?2?×?22×2。
?
非常感謝您閱讀本文,有任何問(wèn)題請(qǐng)?jiān)谙旅媪粞裕?/h1>
?