因子分析怎么做?數(shù)據(jù)為什么要標(biāo)準(zhǔn)化?
數(shù)據(jù)分析工作,并不是直接從分析開始的,當(dāng)拿到一份要分析的數(shù)據(jù),往往需要先進(jìn)行一項(xiàng)基礎(chǔ)工作-數(shù)據(jù)處理。數(shù)據(jù)處理一般的操作方法,正如SPSSAU【數(shù)據(jù)處理】板塊中所提供的這些處理方法。

并且上圖的【生成變量】方法中包涵了多種對(duì)數(shù)據(jù)變量重新處理的方法:

其中數(shù)據(jù)的標(biāo)準(zhǔn)化處理,是在進(jìn)行很多數(shù)據(jù)分析之前都需要做的:
在一些分析比如主成分分析、因子分析、線性回歸分析等均希望數(shù)據(jù)標(biāo)準(zhǔn)化處理。
同時(shí)一些綜合性評(píng)價(jià)方法還會(huì)要求更多的數(shù)據(jù)處理,比如中心化等,中心化是指:X-平均值。
還有一些經(jīng)管類的方法:比如中介作用、調(diào)節(jié)作用等均要求標(biāo)準(zhǔn)化。
如果不進(jìn)行標(biāo)準(zhǔn)化處理,后面的分析結(jié)果可能會(huì)存在誤差。
數(shù)據(jù)的標(biāo)準(zhǔn)化處理主要是為了消除指標(biāo)之間的量綱和取值范圍差異的影響。什么是消除指標(biāo)的量綱?一般情況下,我們所收集的數(shù)據(jù)是有單位的,比如收集到一份個(gè)人信息,其中包括人的身高和體重兩個(gè)指標(biāo),身高有單位cm,體重有單位kg,消除指標(biāo)的量綱就是消除它們的單位,當(dāng)不同指標(biāo)的量級(jí)差別很大時(shí),消除量綱是有必要的,否則,數(shù)據(jù)的分析結(jié)果可能由量級(jí)較大的指標(biāo)值決定,而忽略了量級(jí)小的指標(biāo),所以消除量綱,使之全部變成沒有單位的數(shù)據(jù),便于之后的分析。
例如下面的案例,需要對(duì)我國各省市的綜合發(fā)展情況做因子分析,表中有六個(gè)指標(biāo)。

像這樣的數(shù)據(jù),有的指標(biāo)值特別大,有的指標(biāo)值特別小,比如“高校數(shù)量”和“人均GDP”這兩個(gè)指標(biāo),那么在進(jìn)行因子分析之前,就需要先對(duì)這六個(gè)指標(biāo)變量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化。
數(shù)據(jù)標(biāo)準(zhǔn)化的處理中,使用最廣泛的一種標(biāo)準(zhǔn)化方法是z-score標(biāo)準(zhǔn)化,這篇文章分享z-score標(biāo)準(zhǔn)化的原理和做法,以及怎么進(jìn)行因子分析。
一、數(shù)據(jù)的Z-score標(biāo)準(zhǔn)化
(1)Z-score標(biāo)準(zhǔn)化原理
z-score標(biāo)準(zhǔn)化是基于原始數(shù)據(jù)的均值μ和標(biāo)準(zhǔn)差σ進(jìn)行的,通過下面的轉(zhuǎn)換公式,就可以將原始值轉(zhuǎn)換為統(tǒng)一的均值為0,標(biāo)準(zhǔn)差為1的數(shù)據(jù)。
z-score標(biāo)準(zhǔn)化轉(zhuǎn)換公式:

新得到的標(biāo)準(zhǔn)化數(shù)據(jù)的意義是“給定數(shù)據(jù)距離均值相對(duì)來說有多少個(gè)標(biāo)準(zhǔn)差”,在均值之上的數(shù)據(jù)會(huì)得到一個(gè)正的標(biāo)準(zhǔn)化分?jǐn)?shù),在均值之下的則得到一個(gè)負(fù)的標(biāo)準(zhǔn)化分?jǐn)?shù)。標(biāo)準(zhǔn)化之后數(shù)據(jù)就會(huì)全部統(tǒng)一起來,不會(huì)有數(shù)據(jù)非常大比如10000,而有的數(shù)據(jù)非常小比如10。如下圖:

適用:z-score標(biāo)準(zhǔn)化的方法適用于一個(gè)變量的最大值和最小值未知的情況,或有超出取值范圍的離群數(shù)據(jù)的情況。
(2)使用SPSSAU對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理
實(shí)際的分析操作中,數(shù)據(jù)標(biāo)準(zhǔn)化處理很簡單,這里以上面的案例數(shù)據(jù)來演示如何做。
1、首先打開SPSSAU網(wǎng)站,上傳好數(shù)據(jù)如下圖:

2、對(duì)6個(gè)衡量各省市的綜合發(fā)展情況的指標(biāo)值進(jìn)行標(biāo)準(zhǔn)化處理,在SPSSAU頁面右側(cè)選擇【數(shù)據(jù)處理】版塊中的【生成變量】按鈕。

3、接著選擇Z標(biāo)準(zhǔn)化方法,選中需要標(biāo)準(zhǔn)化的6個(gè)指標(biāo),點(diǎn)擊【確認(rèn)處理】即可。

4、處理結(jié)果
SPSSAU系統(tǒng)自動(dòng)生成新的標(biāo)準(zhǔn)化后的指標(biāo)變量,原始指標(biāo)值仍然存在。

此時(shí)也可以查看具體的標(biāo)準(zhǔn)化后的數(shù)值,可以看到所有的數(shù)據(jù)都被壓縮到了特定區(qū)間內(nèi):

這樣就完成了數(shù)據(jù)標(biāo)準(zhǔn)化處理,接下來可以用標(biāo)準(zhǔn)化后的數(shù)據(jù)做因子分析了。
二、因子分析
SPSSAU中提供現(xiàn)成的因子分析方法,可以快速完成,操作如下:
(1)操作步驟
在SPSSAU頁面左側(cè)選擇【進(jìn)階方法】中的【因子】按鈕,將標(biāo)準(zhǔn)化后的6個(gè)指標(biāo)變量拖拽到頁面右側(cè)的分析框中,根據(jù)研究實(shí)際情況選擇因子數(shù)量,這里選擇3個(gè),點(diǎn)擊【開始分析】即可得出因子分析結(jié)果。

(2)輸出結(jié)果
SPSSAU共輸出4個(gè)結(jié)果表格,自動(dòng)生成2個(gè)可視化圖形,分別如下:
1、KMO和Bartlett的檢驗(yàn):

因子分析探索定量數(shù)據(jù)可以濃縮為幾個(gè)方面(因子),每個(gè)方面(因子)和題項(xiàng)對(duì)應(yīng)關(guān)系;
第一:分析KMO值;如果此值高于0.8,則說明非常適合進(jìn)行因子分析;如果此值介于0.7~0.8之間,則說明比較適合進(jìn)行因子分析;如果此值介于0.6~0.7,則說明可以進(jìn)行因子分析;如果此值小于0.6,說明不適合進(jìn)行因子分析;
第二:如果Bartlett檢驗(yàn)對(duì)應(yīng)p值小于0.05也說明適合進(jìn)行因子分析;
第三:如果僅兩個(gè)分析項(xiàng),則KMO無論如何均為0.5。
2、方差解釋率表格

3、旋轉(zhuǎn)后因子載荷系數(shù)表格

4、成份得分系數(shù)矩陣

5、碎石圖

6、載荷圖

7、線性組合系數(shù)及權(quán)重結(jié)果

三、總結(jié)
總之,在做因子分析之前,一般需要先進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,消除數(shù)據(jù)指標(biāo)的量綱影響,數(shù)據(jù)標(biāo)準(zhǔn)化與因子分析在SPSSAU在線SPSS數(shù)據(jù)分析工具中都被傻瓜化處理,只需要點(diǎn)點(diǎn)拽拽即可完成,更方便統(tǒng)計(jì)入門者使用。