卡方檢驗(yàn)案例
通常情況下,卡方檢驗(yàn)是研究分類(lèi)數(shù)據(jù)與分類(lèi)數(shù)據(jù)之間關(guān)系的分析方法,如研究性別和是否吸煙之間的關(guān)系??ǚ綑z驗(yàn)通常會(huì)涉及卡方值和p值兩個(gè)名詞術(shù)語(yǔ)??ǚ街蹬cp值有對(duì)應(yīng)關(guān)系,p值小于0.05則說(shuō)明有差異存在,即性別與是否吸煙之間有聯(lián)系。
一、案例背景
某調(diào)查研究青少年近視情況,共有117人參與調(diào)查,調(diào)查者年齡范圍5~14歲,年齡段分組分別為5~8歲,8~11歲以及11~14歲,觀察不同年齡組與是否近視之間的關(guān)系。(PS:案例僅供參考,并無(wú)實(shí)際意義)部分?jǐn)?shù)據(jù)如下
二、預(yù)處理
首先將“年齡”進(jìn)行虛擬啞變量處理;得到3個(gè)啞變量即3個(gè)標(biāo)題,分別代表‘是否5~8歲’,‘8~11歲’和‘11~14歲’;
將因變量Y與新得到的3個(gè)啞變量進(jìn)行卡方檢驗(yàn)。
三、結(jié)果說(shuō)明
研究不同年齡段和是否近視之間的關(guān)系。結(jié)果將從基本分析結(jié)果、圖示化以及統(tǒng)計(jì)過(guò)程值三個(gè)方面進(jìn)行說(shuō)明。
基本分析結(jié)果
首先分析X分別與Y之間是否呈現(xiàn)出顯著性(一般觀察p值小于0.05或0.01);從上表可知:8~11歲時(shí)p值>0.05,其余兩項(xiàng)均小于0.05 ,所以不同近視情況樣本對(duì)于8~11歲不會(huì)表現(xiàn)出顯著性差異,另外,近視情況樣本對(duì)于5~8歲, 11~14歲共2項(xiàng)呈現(xiàn)出顯著性差異。
并且5~8歲的少兒,近視占比為18.37%,占比較小,但是家長(zhǎng)在孩子5~8歲時(shí)也需要注意保護(hù)視力。年齡11~14歲的孩子,近視占比為51.02%已經(jīng)超過(guò)了一半,更加需要注意。接下來(lái)查看堆積柱形圖也許能夠更直觀的看出數(shù)據(jù)情況。
圖示化
(1)5~8歲
綠色代表5~8歲青少年近視情況,可以直觀的看出調(diào)查范圍內(nèi),不近視的人占比相對(duì)于近視群體多一些。
(2)8~11歲
綠色代表8~11歲青少年近視情況,可以直觀的看出調(diào)查范圍內(nèi),不近視的人占比與近視群體差不多,沒(méi)有很大差異。
(3)11~14歲
綠色代表11~14歲青少年近視情況,可以直觀的看出調(diào)查范圍內(nèi),近視的人占比相較于不近視群體多一些,有明顯差異。
統(tǒng)計(jì)過(guò)程值
從上表格可以看出,研究不同年齡對(duì)于是否近視的差異關(guān)系,由于是否為該年齡段共分為2類(lèi),膽固醇分為2類(lèi);2*2格式的卡方檢驗(yàn),期望頻數(shù)大于5的格子總數(shù)比例為100%,因而最終選擇使用pearson卡方值。
從上表可知,不同近視情況樣本對(duì)于8~11歲不會(huì)表現(xiàn)出顯著性差異,另外,近視情況樣本對(duì)于5~8歲, 11~14歲共2項(xiàng)呈現(xiàn)出顯著性差異。
補(bǔ)充說(shuō)明:
Pearson卡方,yates校正卡方,也或者Fisher卡方的選擇標(biāo)準(zhǔn)如下:
下述中n代表總樣本量;E代表期望頻數(shù);R代表X的類(lèi)別個(gè)數(shù);C代表Y的類(lèi)別個(gè)數(shù)。
針對(duì)2*2(R=2,C=2)
n>=40 且 E全部>=5則使用Pearson卡方;
n>=40但其中有1個(gè)格子出現(xiàn)1 <=E<5則使用yates校正卡方;
任何一格子出現(xiàn)E <1或n<40則使用Fisher卡方;
針對(duì)R*C(R,C中任意一個(gè)大于2;且R>=2,且C>=2)
E全部>1 且 1 <=E<5格子的比例小于20% 則使用Pearson卡方,否則使用yates校正卡方。除此之外SPSSAU還提供了多重比較以及趨勢(shì)卡方研究如有需要可以進(jìn)行分析在結(jié)果里查看。
五、總結(jié)
本篇案例的數(shù)據(jù)比較特殊,結(jié)果展示包含多個(gè)卡方值和p值,研究青少年近視情況,共有117人參與調(diào)查,首先將數(shù)據(jù)進(jìn)行啞變量處理,將因變量Y與新得到的3個(gè)啞變量進(jìn)行卡方檢驗(yàn),對(duì)結(jié)果從基本分析結(jié)果、圖示化以及統(tǒng)計(jì)過(guò)程值三個(gè)方面進(jìn)行說(shuō)明。發(fā)現(xiàn)不同近視情況樣本對(duì)于8~11歲不會(huì)表現(xiàn)出顯著性差異,近視情況樣本對(duì)于5~8歲, 11~14歲共2項(xiàng)呈現(xiàn)出顯著性差異。并且在著重關(guān)注11~14歲的青少年視力情況。注意用眼衛(wèi)生,坐姿等。