16種常用的數(shù)據(jù)分析方法-列聯(lián)分析
列聯(lián)分析通常用來分析兩個(gè)分類變量之間或者一個(gè)分類變量與順序變量之間是否存在關(guān)聯(lián),關(guān)聯(lián)的緊密程度如何。
對關(guān)聯(lián)性問題的處理稱為獨(dú)立性檢驗(yàn)(Test of Independence),通過交叉列聯(lián)表和檢驗(yàn)進(jìn)行列聯(lián)分析。
交叉列聯(lián)表分為二維表與三維表兩種,二維表交叉表可進(jìn)行卡方檢驗(yàn),三維交叉表,可作Mentel-Hanszel分層分析。
?
列聯(lián)表結(jié)構(gòu)
2*2 列聯(lián)表
*c?列聯(lián)表
?
案例
公司在4個(gè)不同的地區(qū)設(shè)有分公司,公司準(zhǔn)備進(jìn)行工資級(jí)別調(diào)整。采用抽樣調(diào)查方式,從4個(gè)分公司共抽取420個(gè)樣本 (人),了解職工對此調(diào)整的看法,交叉統(tǒng)計(jì)結(jié)果如下:
?
觀察頻數(shù)分布表&百分比分布表的分布
列聯(lián)交叉表中的統(tǒng)計(jì)值有兩種類型:頻數(shù)與百分比,對于兩種類型的分布表,觀察其分布時(shí),要注意:
一、頻數(shù)分布表
? 1、觀察邊緣分布
行邊緣分布:行觀察值的合計(jì)數(shù)的分布
列邊緣分布:列觀察值的合計(jì)數(shù)的分布
2、觀察條件分布與條件頻數(shù)
變量 條件下變量 ? 的分布,或在變量 ? 條件下變量 的分布
每個(gè)具體的觀察值稱為條件頻數(shù)
二、百分比分布
為在相同的基數(shù)上進(jìn)行比較,可以計(jì)算相應(yīng)的百分比,稱為
1、觀察行百分比:行的每一個(gè)觀察頻數(shù)除以相應(yīng)的行合計(jì)數(shù)(/ )
2、觀察列百分比:列的每一個(gè)觀察頻數(shù)除以相應(yīng)的列合計(jì)數(shù)( / )
3、觀察總百分比:每一個(gè)觀察值除以觀察值的總個(gè)數(shù)( / )
?
交叉列聯(lián)表分析步驟
1.【分析】—【描述統(tǒng)計(jì)】—【交叉表】
【精確】
一般情況下,"精確檢驗(yàn)"(Exact Tests)對話框的選項(xiàng)都默認(rèn)為系統(tǒng)默認(rèn)值,不作調(diào)整。
【統(tǒng)計(jì)量】
【單元格】
【格式】
2.結(jié)果分析:
卡方檢驗(yàn)
原假設(shè):H:職稱、學(xué)歷兩者相互獨(dú)立。
皮爾遜(Pearson)的Chi-Square 值為18.553,自由度為9,
p=.029<0.05,拒絕原假設(shè),即在5%的顯著性水平下不同文化程度對職稱的影響存在著顯著差異。
結(jié)論:文化程度越高,職稱越高。