「SPSSAU|數(shù)據(jù)分析」:因子分析步驟匯總

研究場(chǎng)景
因子分析(探索性因子分析)用于探索分析項(xiàng)(定量數(shù)據(jù))應(yīng)該分成幾個(gè)因子(變量),比如20個(gè)量表題項(xiàng)應(yīng)該分成幾個(gè)方面較為合適;用戶(hù)可自行設(shè)置因子個(gè)數(shù),如果不設(shè)置,系統(tǒng)會(huì)以特征根值大于1作為判定標(biāo)準(zhǔn)設(shè)定因子個(gè)數(shù)。
數(shù)據(jù)格式
因子分析時(shí),一列標(biāo)識(shí)1個(gè)指標(biāo),一行為1個(gè)樣本;如果為面板數(shù)據(jù),比如100家公司每家公司10年,那么就會(huì)有100*10=1000個(gè)樣本,可能需要單獨(dú)兩列分別是公司名和年份來(lái)標(biāo)識(shí)面板格式而已,但因子分析并不區(qū)分是否面板數(shù)據(jù),只針對(duì)指標(biāo)進(jìn)行分析即可,另一般分析樣本量需要超出分析項(xiàng)(指標(biāo))的5倍,類(lèi)似數(shù)據(jù)格式如下圖:

SPSSAU操作
1.上傳數(shù)據(jù)
登錄賬號(hào)后進(jìn)入SPSSAU頁(yè)面,點(diǎn)擊右上角“上傳數(shù)據(jù)”,將處理好的數(shù)據(jù)進(jìn)行“點(diǎn)擊上傳文件”上傳即可。

2.拖拽分析項(xiàng)
在“進(jìn)階方法”模塊中選擇“因子”方法,將分析項(xiàng)定量拖拽到右側(cè)分析框內(nèi),點(diǎn)擊“開(kāi)始分析”即可。

補(bǔ)充說(shuō)明:如果有預(yù)期想提取的因子個(gè)數(shù),可以主動(dòng)設(shè)置輸出的因子個(gè)數(shù)勾選“因子得分”與“綜合得分”會(huì)在左側(cè)分析框生成新的變量,標(biāo)題如CompScore*****(綜合得分)、FactorScore*****(因子得分)。因子得分可用于進(jìn)一步分析,比如聚類(lèi)分析,回歸分析使用等;綜合得分可用于對(duì)比排名等。
因子個(gè)數(shù):多數(shù)情況下,我們?cè)诜治鰰r(shí)已經(jīng)帶著主觀預(yù)期,希望題項(xiàng)如何歸類(lèi),此時(shí)可以直接設(shè)置對(duì)應(yīng)的因子個(gè)數(shù)。
調(diào)整分析項(xiàng)
當(dāng)前有一份數(shù)據(jù),共涉及A1~A4,B1~B4,C1~C3,D1~D3共14個(gè)量表題,希望將此14個(gè)量表題使用因子分析濃縮成幾個(gè)維度。從背景情況上看,預(yù)期此14個(gè)題目可分為4個(gè)維度,分別稱(chēng)作A,B,C和D維度。當(dāng)然有可能個(gè)別項(xiàng)并不合適,因此有可能對(duì)其進(jìn)行刪除處理。
1.第一次分析

從上圖中可以看出:
A1~A4這4項(xiàng),它們?nèi)繉?duì)應(yīng)著因子3時(shí),因子載荷系數(shù)值均高于0.4,說(shuō)明此4項(xiàng)應(yīng)該同屬于一個(gè)維度,即邏輯上A1~A4這4項(xiàng),并沒(méi)有出現(xiàn)‘張冠李戴’現(xiàn)象。但是A1和A2這兩項(xiàng)出現(xiàn)‘糾纏不清’現(xiàn)象,A1和A2除了可以對(duì)應(yīng)因子3,也可以放在因子1下面。一般出現(xiàn)‘糾纏不清’現(xiàn)象時(shí),暫時(shí)保留,先處理清楚‘張冠李戴’問(wèn)題更好。
B1~B4共4項(xiàng),B2,B3,B4這3項(xiàng)對(duì)應(yīng)著因子1下面,但是B1卻對(duì)應(yīng)著因子2,因此B1這項(xiàng)屬于‘張冠李戴’,應(yīng)該將B1刪除。B2同時(shí)對(duì)應(yīng)因子1和因子2均可,屬于‘糾纏不清’,暫不處理B2。
C1~C3共3項(xiàng),此3項(xiàng)均對(duì)應(yīng)著因子2,此3項(xiàng)并沒(méi)有出現(xiàn)‘糾纏不清’或者‘張冠李戴’問(wèn)題。
D1~D3共3項(xiàng),D3出現(xiàn)了‘張冠李戴’問(wèn)題,應(yīng)該進(jìn)行刪除處理。D2出現(xiàn)了‘糾纏不清問(wèn)題’(可對(duì)應(yīng)因子1和因子4),應(yīng)該給予關(guān)注。
總結(jié)上述分析可知:B1和D3這兩項(xiàng)出現(xiàn)‘張冠李戴’,應(yīng)該首先將此兩項(xiàng)刪除;而A1,A2,B2,D2共四項(xiàng)有出現(xiàn)‘糾纏不清現(xiàn)象’,暫時(shí)不處理(進(jìn)行關(guān)注即可)。將B1和D3這兩項(xiàng)刪除后,進(jìn)行第二次分析。
2.第二次分析

總結(jié)可知:A1出現(xiàn)“張冠李戴”現(xiàn)象,應(yīng)該將A1先刪除后再次進(jìn)行第3次分析,另對(duì)A2和D2(“糾纏不清”)這兩項(xiàng)給予關(guān)注。
3.第三次分析

D2可同時(shí)出現(xiàn)在因子2和因子4下面,但考慮到D維度當(dāng)前僅余下2項(xiàng),因而表示可以接受,最終是將D2歸納到因子4即D維度下面。最終找出A,B,C和D共4個(gè)維度,它們分別與項(xiàng)之間的對(duì)應(yīng)關(guān)系良好。因子分析結(jié)束。?“糾纏不清”:比如A1可歸屬為A維度,同時(shí)也可歸屬到C維度,這種情況較為正常(稱(chēng)作‘糾纏不清’),需要結(jié)合實(shí)際情況處理即可,可將A1刪除,也可不刪除,帶有一定主觀性。因子分析是一個(gè)多次重復(fù)的過(guò)程,比如刪除某個(gè)或多個(gè)題項(xiàng)后,則需要重新再次分析進(jìn)行對(duì)比選擇等。最終目的在于:維度與分析項(xiàng)對(duì)應(yīng)關(guān)系,與專(zhuān)業(yè)知識(shí)情況基本吻合。
“張冠李戴”:比如A1歸屬為A維度,但是卻歸屬為C維度下,出現(xiàn)這種情況一般進(jìn)行刪除,重新分析。
SPSSAU分析

1.KMO 和 Bartlett 的檢驗(yàn)

使用因子分析進(jìn)行信息濃縮研究,首先分析研究數(shù)據(jù)是否適合進(jìn)行因子分析,從上表可以看出:KMO為0.876,大于0.6,滿足因子分析的前提要求,意味著數(shù)據(jù)可用于因子分析研究。以及數(shù)據(jù)通過(guò)Bartlett 球形度檢驗(yàn)(p<0.05),說(shuō)明研究數(shù)據(jù)適合進(jìn)行因子分析。

2.方差解釋率表格
主要用于判斷提取多少個(gè)因子合適。以及每個(gè)因子的方差解釋率和累計(jì)方差解釋率情況。方差解釋率越大說(shuō)明因子包含原數(shù)據(jù)信息的越多。因子分析中,主要關(guān)注旋轉(zhuǎn)后的數(shù)據(jù)部分。
從上表可知:累積方差解釋率值為78.213%,說(shuō)明提取出來(lái)的4個(gè)因子可以提取出總共11項(xiàng)中78.213%的信息量,而且四個(gè)因子的方差解釋率(信息提取量)分別為:21.407%,21.277%,20.807%和14.723%。信息提取量分布較為均勻,綜合說(shuō)明本次因子分析結(jié)果良好。
補(bǔ)充說(shuō)明:如果研究人員并沒(méi)有預(yù)設(shè)維度。而選擇默認(rèn)選項(xiàng),SPSSAU默認(rèn)以特征根大于1作為標(biāo)準(zhǔn)。當(dāng)然因子分析通常需要綜合自己的專(zhuān)業(yè)知識(shí)綜合判斷,即使是特征根值小于1,也一樣可以提取因子。

3.旋轉(zhuǎn)后因子載荷系數(shù)表格

從上表可知:所有研究項(xiàng)對(duì)應(yīng)的共同度值均高于0.4,意味著研究項(xiàng)和因子之間有著較強(qiáng)的關(guān)聯(lián)性,因子可以有效的提取出信息。最終對(duì)濃縮出來(lái)的四個(gè)因子進(jìn)行分別命名為:A,B,C和D維度。
4.碎石圖

同時(shí)可結(jié)合碎石圖輔助判斷因子提取個(gè)數(shù)。當(dāng)折線由陡峭突然變得平穩(wěn)時(shí),陡峭到平穩(wěn)對(duì)應(yīng)的因子個(gè)數(shù)即為參考提取因子個(gè)數(shù)。實(shí)際研究中更多以專(zhuān)業(yè)知識(shí),結(jié)合因子與研究項(xiàng)對(duì)應(yīng)關(guān)系情況,綜合權(quán)衡判斷得出因子個(gè)數(shù)。
補(bǔ)充說(shuō)明:因子計(jì)算權(quán)重
5.成份得分系數(shù)矩陣


6.載荷圖

載荷圖用于展示各因子與載荷值關(guān)系情況,建議結(jié)合實(shí)際情況使用即可。
第一:如果提取1個(gè)成分(或因子)時(shí),則無(wú)法展示載荷成分圖;
第二:如果超過(guò)個(gè)成分(或因子)時(shí),可自主切換查看對(duì)應(yīng)的載荷圖。
其中X軸Y軸可以更改如下:

7.線性組合系數(shù)及權(quán)重結(jié)果


其它問(wèn)題
1.因子分析計(jì)算權(quán)重?
如果使用因子分析的目的在于計(jì)算權(quán)重,此時(shí)可使用旋轉(zhuǎn)后方差解釋率值進(jìn)行權(quán)重計(jì)算。比如提取2個(gè)因子,旋轉(zhuǎn)后的方差解釋率分別是39.759%,24.061%,旋轉(zhuǎn)后累積方差解釋率為63.820%。那么歸一化(即除累積方差解釋率)即得到權(quán)重,計(jì)算如下表:
2. 無(wú)論如何均‘張冠李戴’或‘糾纏不清’?
‘張冠李戴’是需要處理的,如果無(wú)論如何都有‘張冠李戴’現(xiàn)象,意味著維度和題項(xiàng)間對(duì)應(yīng)關(guān)系有問(wèn)題。可考慮減少因子個(gè)數(shù)進(jìn)行對(duì)比分析。
【特別提示:因子分析是一個(gè)來(lái)回多次重復(fù)對(duì)比,結(jié)合軟件輸出和自身專(zhuān)業(yè)知識(shí)情況綜合選擇對(duì)比找出最優(yōu)結(jié)果的過(guò)程】‘糾纏不清’這種現(xiàn)象,多數(shù)時(shí)候并不需要處理。
3. 最大方差旋轉(zhuǎn)問(wèn)題?
SPSSAU默認(rèn)使用最大方差旋轉(zhuǎn)法(Varimax)對(duì)數(shù)據(jù)進(jìn)行旋轉(zhuǎn)。特征根,方差解釋率和累積方差解釋率這三項(xiàng)均區(qū)分旋轉(zhuǎn)前和旋轉(zhuǎn)后;如果讓軟件自動(dòng)識(shí)別因子個(gè)數(shù),是以旋轉(zhuǎn)前特征根大于1作為標(biāo)準(zhǔn);其余情況下的分析建議以旋轉(zhuǎn)后作為標(biāo)準(zhǔn)。
4.綜合得分如何使用?
綜合得分可用于對(duì)比綜合競(jìng)爭(zhēng)力情況,綜合得分值越高,此時(shí)綜合競(jìng)爭(zhēng)力越強(qiáng)。此類(lèi)應(yīng)用常見(jiàn)于經(jīng)濟(jì)、管理類(lèi)研究,比如上市公司的競(jìng)爭(zhēng)實(shí)力對(duì)比。
綜合得分需要選中按鈕才會(huì)生效,且SPSSAU單獨(dú)生成一列新標(biāo)題名稱(chēng)類(lèi)似為:“Comp_score****”,一般情況下用戶(hù)需要把綜合得分的原始數(shù)據(jù)下載出來(lái)使用,通過(guò)右上角‘我的數(shù)據(jù)->下載’,可將綜合得分下載出來(lái)使用。
5.‘分析之前是否需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理’?
SPSSAU默認(rèn)就已經(jīng)進(jìn)行過(guò)標(biāo)準(zhǔn)化處理,因此不需要再對(duì)數(shù)據(jù)處理。當(dāng)然標(biāo)準(zhǔn)化后的數(shù)據(jù)再次標(biāo)準(zhǔn)化依舊還是自身沒(méi)有任何變化,結(jié)果永遠(yuǎn)均一致。
6. 綜合得分如何計(jì)算得到的?
SPSSAU默認(rèn)提供保存綜合得分,至于其計(jì)算原理,比如說(shuō)提取得到4個(gè)因子,并且此4個(gè)因子的旋轉(zhuǎn)后方差解釋率分別是21.407%,21.277%,20.807%和14.723%;累積方差解釋率值為78.213%。綜合得分計(jì)算公式為:求和(因子得分*旋轉(zhuǎn)后方差解釋率)/累積方差解釋率。如下圖所示:
總結(jié)
因子分析往往是預(yù)處理步驟,后續(xù)還需要結(jié)合具體研究目的進(jìn)行分析,如回歸分析、聚類(lèi)分析等。對(duì)于探索性因子分析完成指標(biāo)權(quán)重,計(jì)算在實(shí)際研究中,通常會(huì)結(jié)合其他分析方法,比如主觀賦權(quán)法(AHP層次分析法),或者客觀賦權(quán)法(熵值法)進(jìn)行權(quán)重計(jì)算,亦或是在主觀賦權(quán)法和客觀賦權(quán)法基礎(chǔ)上,結(jié)合組合賦值法完成最終權(quán)重計(jì)算。