因子分析步驟
探索性因子分析的步驟:
接下來,通過一個案例演示因子分析(探索性因子分析)的各個步驟應(yīng)該如何進行。
案例:欲探究我國不同省份鐵路運輸能力情況,收集到部分相關(guān)數(shù)據(jù)如下:
上傳數(shù)據(jù)至SPSSAU系統(tǒng),在【進階方法】模塊,選擇【探索性因子分析】,將變量拖拽到右側(cè)分析框,勾選“因子得分”與“綜合得分”,旋轉(zhuǎn)方法選擇默認的“最大方差法”,操作如下圖:
一、指標數(shù)據(jù)標準化處理
由于指標數(shù)據(jù)性質(zhì)不同,具有不同的數(shù)量級和量綱,會導(dǎo)致分析結(jié)果不準確或產(chǎn)生誤差。因此,先對原始數(shù)據(jù)進行標準化處理。SPSSAU因子分析將自動進行標準化處理,因此不需要再對數(shù)據(jù)進行處理。
標準化計算公式:(X-Mean)/ Std
二、因子分析適用性檢驗
進行因子分析的前提是數(shù)據(jù)適合使用該方法,通常采取KMO檢驗和Bartlett球形檢驗。KMO檢驗用于檢查變量間的相關(guān)性,取值為0~1。KMO值越接近于1,變量間的相關(guān)性越強,一般該值大于0.6即可進行因子分析。Bartlett球形檢驗用于檢驗變量是否各自獨立,通常顯著性小于0.05時,說明符合標準,適合做因子分析。
本案例SPSSAU輸出KMO和Bartlett球形檢驗結(jié)果如下:
從結(jié)果來看,KMO值為0.722大于0.6,所以可以進行因子分析。同時Bartlett球形檢驗結(jié)果顯示p值小于0.05,可以進行因子分析。
三、提取公因子
以特征根大于1為標準提取公因子,SPSSAU得到各因子的特征根以及方差解釋率見下表:
分析上表可知,特征根大于1的因子共有兩個,這2個公因子的累計方差解釋率為78.808%,第一個因子的方差解釋率為41.346%,第二個因子的方差解釋率為37.462%,說明提取的兩個公因子能夠代表原來6個鐵路運輸能力指標78.808%的信息,整體來看信息變量丟失較少,因子分析效果比較理想。
另外,從特征根的碎石圖可以更為直觀的看出擬提取的公因子。如上圖,前兩個因子的讓特征根值均大于1,且曲線比價陡峭,剩下4個特征根值均小于1且特征根值曲線逐漸變得比較平緩,即提取前2個因子可以代表所有原始鐵路運輸指標的絕大部分信息,與方差解釋率得到結(jié)果一致。
四、公因子命名與解釋
找到公因子后,為了理解公因子的實際意義以及方便對問題進行分析,需要繼續(xù)進行因子旋轉(zhuǎn)。旋轉(zhuǎn)常用方法為最大方差法。旋轉(zhuǎn)后的因子載荷矩陣可以直觀反映各個變量對主成分的貢獻程度,一個變量在某個公因子上的載荷系數(shù)的絕對值越大,說明變量與該公因子越具有相關(guān)性。
下表為使用最大方差法進行旋轉(zhuǎn)后得到的因子載荷系數(shù)表格:
分析上表可知,因子1在鐵路貨運總量、鐵路營業(yè)里程、鐵路貨物總周轉(zhuǎn)量上具有較大的載荷,因此這3個變量歸為一類命名為貨運因子(記作F1)。因子2在鐵路客運量、鐵路旅客周轉(zhuǎn)量、鐵路運輸職工人數(shù)上具有較大的載荷,因此這3個變量歸為另一類命名為客運因子(記作F2)。
五、計算因子得分
確定因子后,進一步計算各因子得分,SPSSAU輸出成份得分系數(shù)矩陣如下:
根據(jù)成份得分系數(shù)矩陣,得到公因子F由變量X表示線性組合的因子得分函數(shù):
F1=-0.203*鐵路客運量-0.178*鐵路旅客周轉(zhuǎn)量+0.537*鐵路貨運總量+0.294*鐵路營業(yè)里程+0.333*鐵路貨物總周轉(zhuǎn)量+0.135*鐵路運輸職工人數(shù)
F2=0.506*鐵路客運量+0.488*鐵路旅客周轉(zhuǎn)量-0.321*鐵路貨運總量+0.025*鐵路營業(yè)里程-0.014*鐵路貨物總周轉(zhuǎn)量+0.197*鐵路運輸職工人數(shù)
這一過程可通過手算完成,但要注意使用的是標準化后的數(shù)據(jù)代入公式。
在我們進行分析前,勾選【因子得分】,SPSSAU自動保存公因子得分,如下圖:
六、計算綜合得分
進行綜合評價將指標數(shù)據(jù)代入因子表達式,計算綜合得分,分析結(jié)果并進行綜合評價。即以2個公因子得分為基礎(chǔ),再以每個因子的方差解釋率為權(quán)數(shù)進行線性加權(quán)平均,最后得到一個綜合得分模型:
注:分子為兩個公因子旋轉(zhuǎn)后方差解釋率,分母為旋轉(zhuǎn)后累計方差解釋率。
勾選【綜合得分】后,SPSSAU將自動保存綜合得分,結(jié)果見下圖:
得到綜合得分后,可將數(shù)據(jù)下載至本地,使用excel對綜合得分進行排序,該排名就代表了31個省份的鐵路運輸能力。最后整理成下面這個一個表格:
分析31個省份鐵路運輸能力綜合得分表可知,河北省的鐵路運輸能力最強,海南省鐵路運輸能力最弱......
至此,因子分析結(jié)束。