「SPSSAU|數(shù)據(jù)分析」:卡方檢驗分析步驟匯總

一、類型
SPSSAU中卡方檢驗包括卡方檢驗、卡方擬合優(yōu)度、配對卡方、分層卡方。
對于上述四種卡方檢驗區(qū)別如下:

二、卡方檢驗分析步驟
1.研究目的
卡方檢驗是研究實際觀測值與理論值之間的偏離程度,實際觀測值與理論值之間的偏離程度決定卡方值的大小,卡方值越大,偏差越大;卡方值越小,偏差越小,越趨于符合,若兩個值完全相等時,卡方值就為0,表明實際觀測值與理論值完全符合。
例如:例如研究人員想知道兩組學生對于手機品牌的偏好差異情況、不同減肥方式對于減肥幫助情況等,可以使用卡方檢驗。
2.數(shù)據(jù)格式
SPSSAU可支持兩類數(shù)據(jù)格式,一種是常規(guī)格式(非加權(quán)格式),另外一種是加權(quán)數(shù)據(jù)格式。
(1)常規(guī)格式

上圖為常規(guī)格式(即非加權(quán)格式),一行代表一個樣本,一列代表一個屬性,將全部的原始數(shù)據(jù)信息列出即可。
(2)加權(quán)格式

在醫(yī)學/實驗研究時,很多時候只有匯總數(shù)據(jù),即帶加權(quán)項的數(shù)據(jù),比如上圖中X有2種情況,Y有3個情況,一種有2*3=6種組合,數(shù)據(jù)信息只有6種組別的匯總項(即加權(quán)項),分別是40,10,20,30,20,50;相當于總共有170個樣本,如果是使用常規(guī)格式(即非加權(quán)格式),此時應該有170行;但加權(quán)格式則只需要6行即可表示,如上圖。
3.上傳數(shù)據(jù)

4.SPSSAU操作步驟
操作步驟分為兩步如下說明:
Step1:點擊實驗/醫(yī)學研究,模塊下的卡方檢驗

Step2:將左側(cè)數(shù)據(jù)拖拽到右側(cè)分析框后,點擊開始分析如下圖

提示:若有加權(quán)項拖拽到右下方即可

5.分析
(1)卡方檢驗分析結(jié)果

從分析結(jié)果中可以看出p<0.05
(2)差異性說明
從上表可以看出:不同減肥方式樣本對于膽固醇水平共1項呈現(xiàn)出顯著性(p<0.05),意味著不同減肥方式樣本對于膽固醇水平共1項均呈現(xiàn)出差異性。
(3)交叉圖

減肥方式和膽固醇水平的交叉圖更直觀看到三種減肥方式與膽固醇水平的關(guān)系。
(4)統(tǒng)計量指標說明


(5)深入指標

卡方檢驗時有多種指標(SPSSAU提供五類)可表示效應量,可結(jié)合數(shù)據(jù)類型及交叉表格類型綜合選擇;
第一:如果是2*2表格,建議使用Phi指標;
第二:如果是3*3,或4*4表格,建議使用列聯(lián)系數(shù);
第三:如果是n*n(n>4)表格,建議使用校正列聯(lián)系數(shù);
第四:如果是m*n(m不等于n)表格,建議使用Cramer V指標;
第五:如果X或Y中有定序數(shù)據(jù),建議使用Lambda指標;
效應量值越大說明差異幅度越大,通常情況下效應量小、中、大的區(qū)分臨界點分別是: 0.20,0.50和0.80。
(6)多重比較
多重比較,對于此案例簡單來說若減肥方式與膽固醇之間存在差異,具體存在哪種差異,需要進行比較。

從上表中可以看到減肥方式與膽固醇之間比較次數(shù)為3次。

(7)趨勢卡方


6.總結(jié)
從上述分析中可知,三類減肥方式與膽固醇水平之間呈現(xiàn)出顯著性差異(χ2=7.054,p =0.029 < 0.05),具體通過對比百分比差異可知,藥物減肥中有83.33%的樣本為膽固醇較低,明顯高于飲食(36.36%)和鍛煉(33.33%)時膽固醇較低的比例,因而說明藥物對于減肥的幫助較高,明顯高于飲食和鍛煉這兩種方式。
三、配對卡方分析步驟
1.研究目的
如果研究配對數(shù)據(jù)的差異性,例如:對于待診患者進行兩種方法診斷,通過研究判斷兩種診斷方法是否有差異性,那么可以使用配對卡方。
2.數(shù)據(jù)格式
配對數(shù)據(jù)一般是在實驗時使用,而且配對數(shù)據(jù)的特點為:行數(shù)一定完全相等并且只有兩列。

配對數(shù)據(jù)一般是在實驗時使用,而且配對數(shù)據(jù)的特點為:行數(shù)一定完全相等并且只有兩列。如果研究數(shù)據(jù)的行數(shù)不相等,那可能不是配對數(shù)據(jù)
3.上傳數(shù)據(jù)

4.SPSSAU分析步驟
操作步驟分為兩步如下說明:
Step1:點擊實驗/醫(yī)學研究,模塊下的卡方檢驗

Step2:將左側(cè)數(shù)據(jù)拖拽到右側(cè)分析框后,點擊開始分析如下圖

提示:若有加權(quán)項拖拽到右下方即可

5.分析
(1)分析結(jié)果

(2)差異性說明
從上表可知,利用配對卡方檢驗去研究A方法三種結(jié)果和B方法三種結(jié)果之間的配對差異關(guān)系,本次配對對比類別數(shù)量大于2(即配對多分類),因而使用Bowker檢驗進行研究。配對數(shù)據(jù)之間呈現(xiàn)0.05水平的顯著性(chi=8.333,p=0.040<0.05),意味著配對數(shù)據(jù)間有著明顯的差異性
(3)兩種方法結(jié)果對比


(4)對比圖

對比圖中可以看到不同項A方法與B方法的百分比。
配對對比類別數(shù)量為2(即配對四表格),使用McNemar檢驗進行研究,配對對比類別數(shù)量大于2(即配對多分類),使用Bowker檢驗進行研究。
四、卡方擬合優(yōu)度檢驗分析步驟
1.研究目的
如果想研究實際與預期比例之間的比較,比如研究實際性別比例情況,是否與預期性別比例表現(xiàn)一致,則要使用卡方擬合優(yōu)度檢驗。(PS:卡方擬合優(yōu)度檢驗只針對類別數(shù)據(jù))
2.數(shù)據(jù)格式
(1)普通格式(非加權(quán))

上圖為常規(guī)格式(即非加權(quán)格式),一行代表一個樣本,一列代表一個屬性,將全部的原始數(shù)據(jù)信息列出即可。
(2)加權(quán)格式

很多時候只有匯總數(shù)據(jù),即帶加權(quán)項的數(shù)據(jù),比如上圖圖中研究項有3種情況,每種情況時樣本量分別是40,10,20;相當于總共有70個樣本,如果是使用常規(guī)格式(即非加權(quán)格式),此時應該有70行;但加權(quán)格式則只需要3行即可表示。
3.上傳數(shù)據(jù)

4.SPSSAU操作步驟

5.分析
(1)分析結(jié)果

此表為卡方擬合優(yōu)度檢驗結(jié)果,其中P值為0.689。
(2)差異性分析
從上表可以看出:性別全部均沒有呈現(xiàn)顯著性(p>0.05),意味著接受原假設(原假設:實際分布比例與預期比例一致),即數(shù)據(jù)分布與預期一致。
(3)圖表

上表可以觀察出不同性別的實際頻數(shù)與期望頻數(shù)的差異,可以看出數(shù)據(jù)分布與預期大概一致。
6.總結(jié)
卡方擬合優(yōu)度檢驗研究定類數(shù)據(jù)的頻數(shù)分布是否與期望頻數(shù)保持一致;第一:期望頻數(shù)默認為完全均勻,可自行設置期望頻數(shù);第二:分析是否呈現(xiàn)出顯著性(p值小于0.05或0.01);第三:如果呈現(xiàn)出顯著性(p<0.05),說明實際頻數(shù)分布與期望分布具有顯著差異;第四:對分析進行總結(jié)。
五、分層卡方分析步驟
1.研究目的
若想考慮另一個干擾因素分層項,比如是否吸煙與是否生病的關(guān)系時,將性別納入考慮范疇,則要使用分層卡方。
2.數(shù)據(jù)格式(加權(quán)形式)

針對分層卡方,SPSSAU支持2*2*k結(jié)構(gòu),即X和Y均為2個類別,k表示分層項的類別數(shù)量。
3.上傳數(shù)據(jù)

4.SPSSAU操作步驟

5.分析
(1)匯總表格


(2)比值比OR值估計

上表格中展示合并OR值或Ln(OR值),及其95%置信區(qū)間。
(3)比值比齊性檢驗


從上表可知:Breslow-Day比值比齊性檢驗并沒有呈現(xiàn)出顯著性(chi=1.089,p=0.580 >0.05),意味著各層之間關(guān)系同質(zhì),分層因素之間不存在混雜作用。
(4)條件獨立性檢驗


(5)差異性說明
從上表可知:Cochran–Mantel–Haenszel條件獨立性檢驗呈現(xiàn)出顯著性(chi=7.055,p=0.008 <0.05),意味著在考慮干擾因素之后,是否吸煙和是否感冒之間呈現(xiàn)出顯著性差異。
6.總結(jié)
通常情況下,首先查看‘比值比齊性檢驗’,如果其呈現(xiàn)出顯著性(p 值小于0.05),則說明具有混雜因素,即需要考慮分層項,即分別查看不同分層項下的數(shù)據(jù)結(jié)果。反之如果沒有通過‘比值比齊性檢驗’,即說明沒有混雜因素不需要考慮分層項,報告整體的結(jié)果即可(包括卡方檢驗,以及OR值)。
Cochran–Mantel–Haenszel條件獨立性用于研究考慮混雜因素(分層項)后,X與Y之間是否還存在著差異關(guān)系,相對意義較小。
六、其它
Q1:什么樣的數(shù)據(jù)格式才適合?
如果數(shù)據(jù)已經(jīng)進行過初步統(tǒng)計,比如下圖中的數(shù)據(jù),膽固醇較高并且使用藥物減肥的數(shù)量為2,膽固醇較低使用鍛煉減肥方式的數(shù)量為3。這種屬于已經(jīng)統(tǒng)計好的數(shù)據(jù),如果希望對此類數(shù)據(jù)進行卡方檢驗,則需要對數(shù)據(jù)格式進行‘改造’。

Q2:多選題卡方檢驗怎么做?
多選題與其他題項的交叉分析也可采用卡方檢驗,只是SPSSAU將多選題單獨設計為一個方法,方法上依然是卡方檢驗。