「SPSSAU|數(shù)據(jù)分析」:因子分析案例

一、案例說明
1.案例數(shù)據(jù)
某“教育網(wǎng)站”想要調(diào)查用戶對于使用、服務(wù)等方面的滿意度,其中共有12個問題,調(diào)研得到259份問卷結(jié)果。部分?jǐn)?shù)據(jù)如下:

補充說明:因子分析數(shù)據(jù)要求為定量或者量表題。
【定量:數(shù)字有比較意義,比如數(shù)字越大代表滿意度越高,量表為典型定量數(shù)據(jù)。量表:通常指李克特量表,測量樣本對于某構(gòu)念(通俗講即某事情)的態(tài)度或看法。】
2.分析目的
希望通過因子分析,用少量因子反映12個題目的信息,從而達(dá)到降低維度,便于分析的目的,并對因子命名以便后續(xù)分析。
此案例的分析思路如下:

二、前提條件

1.KMO值
KMO檢驗是為了看數(shù)據(jù)是否適合進(jìn)行因子分析,其取值范圍是0-1。具體劃分如下:

本例中KMO取值為0.887,說明KMO值達(dá)到因子分析要求,至于是否可以進(jìn)行因子分析還需要進(jìn)一步查看Bartlett球形檢驗。
2. Bartlett球形檢驗
我們利用Bartlett檢驗是為了看數(shù)據(jù)是否來自服從多元正態(tài)分布的總體。本例中p值<0.05,具有顯著性差異。說明數(shù)據(jù)來自正態(tài)分布總體,適合進(jìn)一步分析。
所以使用因子分析進(jìn)行信息濃縮研究,首先分析研究數(shù)據(jù)是否適合進(jìn)行因子分析,從上表可以看出:KMO為0.887,大于0.6,滿足因子分析的前提要求,意味著數(shù)據(jù)可用于因子分析研究。以及數(shù)據(jù)通過Bartlett 球形度檢驗(p<0.05),說明研究數(shù)據(jù)適合進(jìn)行因子分析。
滿足前提條件后接下來我們分?jǐn)?shù)數(shù)據(jù)提取因子的個數(shù)。
三、因子提取

1.方差解釋率
方差解釋率越大說明因子包含原數(shù)據(jù)信息的越多。因子分析中,主要關(guān)注旋轉(zhuǎn)后的數(shù)據(jù)部分。由上圖可以顯示12個指標(biāo)中,第一個因子的方差解釋率為25.799%,是由特征根3.096/12(指標(biāo)個數(shù))得到的。第二個因子的方差解釋率為24.815%,第三個因子的方差解釋率為22.117%,累積方差解釋率由三者相加為72.730%,累積方差解釋率這個值沒有固定標(biāo)準(zhǔn),一般超過60%都可以接受。特征根對于因子的提取有什么作用,以下展開來說。
2.特征根
特征根一般是指標(biāo)旋轉(zhuǎn)前每個因子的貢獻(xiàn)程度。此值的總和與項目數(shù)匹配,此值越大,代表因子貢獻(xiàn)越大。當(dāng)然因子分析通常需要綜合自己的專業(yè)知識綜合判斷,即使是特征根值小于1,也一樣可以提取因子。如果不選擇因子個數(shù)SPSSAU自動識別因子最佳個數(shù)的指標(biāo),通常以特征根大于1作為標(biāo)準(zhǔn)。實際應(yīng)用中,多數(shù)時候是自行設(shè)置因子個數(shù)。特征根只是作為輔助判斷之用。如果研究人員并沒有預(yù)設(shè)維度。而選擇默認(rèn)選項,SPSSAU默認(rèn)以特征根大于1作為標(biāo)準(zhǔn)。如下圖:

上表格針對因子提取情況,以及因子提取信息量情況進(jìn)行分析,從上表可知:因子分析一共提取出3個因子,此3個因子旋轉(zhuǎn)后的方差解釋率分別是25.799%,24.815%,22.117%,旋轉(zhuǎn)后累積方差解釋率為72.730%。
除了特征根外,碎石圖也可以輔助決策提取因子個數(shù)。
3.碎石圖

從圖中可以看出,橫軸表示指標(biāo)數(shù),縱軸表示特征根值,當(dāng)提取前3個因子時,特征根值較大,變化較明顯,對解釋原有變量的貢獻(xiàn)較大;當(dāng)提取3個以后的因子時,特征根值較小,變化也很小,對原有變量貢獻(xiàn)相對較小,由此可見提取前三個因子對原變量有的顯著作用。碎石圖僅輔助決策因子個數(shù),如果由此圖分析兩個因子也是可以的。

本案例按專業(yè)知識來看提取三個因子,如果沒有預(yù)設(shè)因子個數(shù)也可以默認(rèn)讓系統(tǒng)進(jìn)行決策。提取后要觀察因子的信息濃縮程度。
四、信息濃縮
1.旋轉(zhuǎn)后因子載荷系數(shù)表

因子載荷系數(shù)表,正是反映因子和研究項對應(yīng)關(guān)系情況。如果某分析項對應(yīng)的多個因子載荷系數(shù)絕對值均低于0.4,可考慮刪除該項。上圖分析中均大于0.4。所以不用刪除調(diào)整。
從結(jié)果中可以看出,使用因子分析對12個項進(jìn)行濃縮處理,濃縮為三個因子。因子與題項對應(yīng)關(guān)系如下:
其中Q5-Q9在因子1上有較高的載荷,說明因子1可以解釋這幾個分析項,它們主要反映了教育網(wǎng)站使用方面的滿意度;
Q1-Q4在因子2上有較高的載荷,它們主要反映了教育網(wǎng)站教學(xué)質(zhì)量方面的滿意度;
Q10-Q12在因子3上有較高的載荷,它們主要反映了網(wǎng)站服務(wù)方面的滿意度;
從上表可知:所有研究項對應(yīng)的共同度值均高于0.4,意味著研究項和因子之間有著較強的關(guān)聯(lián)性,因子可以有效的提取出信息。
2.調(diào)整因子
一般情況下,如果12項與3個因子之間的對應(yīng)關(guān)系情況,與專業(yè)知識情況不符合,比如Q1被劃分到了第一個因子下面,此時則說明可能Q1這項應(yīng)該被刪除處理,其出現(xiàn)了‘張冠李戴’現(xiàn)象。因而在進(jìn)行分析時很可能會對部分不合理項進(jìn)行刪除處理。除此之外,也有可能會出現(xiàn)‘糾纏不清’現(xiàn)象。
關(guān)于因子和題項對應(yīng)關(guān)系,因子和題項之間交叉會得到一個‘因子載荷系數(shù)’,此系數(shù)絕對值大于0.4,則說明二者有著較強關(guān)聯(lián)性,該題項可以與該維度(因子)有著對應(yīng)關(guān)系。
(1)“糾纏不清”
有時候會出現(xiàn)‘糾纏不清’現(xiàn)象,比如Q6可歸屬為因子1 ,同時也可歸屬到因子3(如下圖),這種情況較為正常(稱作‘糾纏不清’),需要結(jié)合實際情況處理即可,可將Q6刪除,也可不刪除,此案例中Q6按分析應(yīng)屬于因子1,所以不進(jìn)行刪除處理,這時,分析帶有一定主觀性。因子分析是一個多次重復(fù)的過程,比如刪除某個或多個題項后,則需要重新再次分析進(jìn)行對比選擇等。最終目的在于:因子與分析項對應(yīng)關(guān)系,與專業(yè)知識情況基本吻合。

由于從分析上看,結(jié)果良好,所以沒有進(jìn)行刪除處理。
PS:題項和因子(維度)對應(yīng)關(guān)系判斷規(guī)則:某項對應(yīng)某因子的因子載荷系數(shù)絕對值大于0.4,則說明該項對應(yīng)該因子。
(2)“張冠李戴”
‘張冠李戴’:其指比如本來應(yīng)該劃分在某因子下,但分到其它因子中;此種情況最終不能被接受,需要刪除這項,該分析中沒有此類情況(所以舉其他例子進(jìn)行說明)。


從上圖中可以看出:
A1~A4這4項,它們?nèi)繉?yīng)著因子3時,因子載荷系數(shù)值均高于0.4,說明此4項應(yīng)該同屬于一個維度,即邏輯上A1~A4這4項,并沒有出現(xiàn)‘張冠李戴’現(xiàn)象。但是A1和A2這兩項出現(xiàn)‘糾纏不清’現(xiàn)象,A1和A2除了可以對應(yīng)因子3,也可以放在因子1下面。一般出現(xiàn)‘糾纏不清’現(xiàn)象時,暫時保留,先處理清楚‘張冠李戴’問題更好。
B1~B4共4項,B2,B3,B4這3項對應(yīng)著因子1下面,但是B1卻對應(yīng)著因子2,因此B1這項屬于‘張冠李戴’,應(yīng)該將B1刪除。B2同時對應(yīng)因子1和因子2均可,屬于‘糾纏不清’,暫不處理B2。
C1~C3共3項,此3項均對應(yīng)著因子2,此3項并沒有出現(xiàn)‘糾纏不清’或者‘張冠李戴’問題。
D1~D3共3項,D3出現(xiàn)了‘張冠李戴’問題,應(yīng)該進(jìn)行刪除處理。D2出現(xiàn)了‘糾纏不清問題’(可對應(yīng)因子1和因子4),應(yīng)該給予關(guān)注。
總結(jié)上述分析可知:B1和D3這兩項出現(xiàn)‘張冠李戴’,應(yīng)該首先將此兩項刪除;而A1,A2,B2,D2共四項有出現(xiàn)‘糾纏不清現(xiàn)象’,暫時不處理(進(jìn)行關(guān)注即可)。將B1和D3這兩項刪除后,進(jìn)行第二次分析。
3.載荷圖

載荷圖用于展示各因子與載荷值關(guān)系情況,建議結(jié)合實際情況使用即可。
第一:如果提取1個成分(或因子)時,則無法展示載荷成分圖;
第二:如果超過個成分(或因子)時,可自主切換查看對應(yīng)的載荷圖。
最后確定了提取的因子數(shù)及題項對應(yīng)關(guān)系,即可對提取的因子命名??梢越Y(jié)合旋轉(zhuǎn)后的因子載荷矩陣結(jié)果進(jìn)行命名,最終將三個因子分別命名為F1用戶體驗、F2教學(xué)質(zhì)量、F3網(wǎng)站服務(wù)。
由分析可以看出三個因子濃縮信息較好,涵蓋了大部分信息,但是因子分析還可以進(jìn)行權(quán)重的計算,如果只是分析則可以忽略以下步驟。
五、計算權(quán)重

線性組合系數(shù)及權(quán)重結(jié)果
(1)計算線性組合系數(shù),公式為:loading矩陣/Sqrt(eigen),即載荷系數(shù)除以對應(yīng)特征根的平方根;

例如:因子1:

因子2:

因子3:

(2)計算綜合得分系數(shù),公式為:累積(線性組合系數(shù)*方差解釋率)/累積方差解釋率,即線性組合系數(shù)分別與方差解釋率相乘后累加,然后除以累積方差解釋率;

綜合得分系數(shù):

以此類推;
(3)計算權(quán)重
將綜合得分系數(shù)進(jìn)行歸一化處理即得到各指標(biāo)權(quán)重值。

求和歸一化:

例:綜合得分系數(shù)和為3.017,(0.268+0.265+…+0.217=3.017)。

補充說明:上述loading矩陣,特征根eigen,方差解釋率或累積方差解釋率均為旋轉(zhuǎn)后對應(yīng)值。
六、其它
1.因子得分


因子分析往往是預(yù)處理步驟,后續(xù)還需要結(jié)合具體研究目的進(jìn)行分析,如回歸分析、聚類分析等。此時,可能需要用到因子得分,返回分析頁面勾選[因子得分]即可生成因子得分。

2.綜合得分
綜合得分如何使用?
綜合得分可用于對比綜合競爭力情況,綜合得分值越高,此時綜合競爭力越強。此類應(yīng)用常見于經(jīng)濟(jì)、管理類研究,比如上市公司的競爭實力對比。
綜合得分需要選中按鈕才會生效,且SPSSAU單獨生成一列新標(biāo)題名稱類似為:“Comp_score****”,一般情況下用戶需要把綜合得分的原始數(shù)據(jù)下載出來使用,通過右上角‘我的數(shù)據(jù)->下載’,可將綜合得分下載出來使用。

七、案例綜述
通過分析我們知道案例數(shù)據(jù)滿足因子分析條件,并且由因子提取個數(shù)可以看出三個因子涵蓋原變量的大部分信息,信息濃縮也較好,以及得到權(quán)重的過程。最后確定了提取的因子數(shù)及題項對應(yīng)關(guān)系,即可對提取的因子命名??梢越Y(jié)合旋轉(zhuǎn)后的因子載荷矩陣結(jié)果進(jìn)行命名,最終將三個因子分別命名為F1用戶體驗、F2教學(xué)質(zhì)量、F3網(wǎng)站服務(wù)。