最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

「SPSSAU|數(shù)據(jù)分析」:主成分分析步驟匯總

2022-04-29 12:10 作者:SPSSAU官方賬號  | 我要投稿


研究背景

主成分分析用于對數(shù)據(jù)信息進(jìn)行濃縮,比如總共有20個指標(biāo)值,是否可以將此20項濃縮成4個概括性指標(biāo)。除此之外,主成分分析可用于權(quán)重計算和綜合競爭力研究。即主成分分共有三個實際應(yīng)用場景:

數(shù)據(jù)格式

主成分分析時,一列標(biāo)識1個指標(biāo),一行為1個樣本;如果為面板數(shù)據(jù),比如100家公司每家公司10年,那么就會有100*10=1000個樣本,可能需要單獨兩列分別是公司名和年份來標(biāo)識面板格式而已,但主成分分析并不區(qū)分是否面板數(shù)據(jù),只針對指標(biāo)進(jìn)行分析即可,另一般分析樣本量需要超出分析項(指標(biāo))的5倍,類似數(shù)據(jù)格式如下圖:

SPSSAU操作

1.上傳數(shù)據(jù)

登錄賬號后進(jìn)入SPSSAU頁面,點擊右上角“上傳數(shù)據(jù)”,將處理好的數(shù)據(jù)進(jìn)行“點擊上傳文件”上傳即可。

2.拖拽分析項

可以勾選“成分得分”以及“綜合得分”點擊開始分析后,左側(cè)分析框就會出現(xiàn),成分得分與綜合得分:

SPSSAU分析

背景:當(dāng)前有一份數(shù)據(jù),共涉及9個指標(biāo),希望將此9個指標(biāo)使用主成分分析進(jìn)行降維,并計算綜合得分。

1.KMO 和 Bartlett 的檢驗?

使用主成分分析進(jìn)行信息濃縮研究,首先分析研究數(shù)據(jù)是否適合進(jìn)行主成分分析,從上表可以看出:KMO為0.913,大于0.6,滿足主成分分析的前提要求,意味著數(shù)據(jù)可用于主成分分析研究。以及數(shù)據(jù)通過Bartlett 球形度檢驗(p<0.05),說明研究數(shù)據(jù)適合進(jìn)行主成分分析。

2.方差解釋率表格

上表格針對主成分提取情況,以及主成分提取信息量情況進(jìn)行分析,從上表可知:主成分分析一共提取出2個主成分,此2個主成分方差解釋率分別是55.907%,8.133%,累積方差解釋率為64.040%另外,本次分析共提取出2個主成分,它們對應(yīng)的加權(quán)后方差解釋率即權(quán)重依次為:55.907/64.040=87.30%;8.133/64.040=12.70%;

3.載荷系數(shù)表格

載荷系數(shù)表格,主要展示主成分對于研究項的信息提取情況,以及主成分和研究項對應(yīng)關(guān)系。

共同度代表某題項可被提取的信息量,共同度越高說明指標(biāo)能被主成分解釋的程度越高,被提取的信息量越多。一般以0.4作為標(biāo)準(zhǔn)。

上表格展示主成分對于研究項的信息提取情況,以及主成分和研究項對應(yīng)關(guān)系,從上表可知:所有研究項對應(yīng)的共同度值均高于0.4,意味著研究項和主成分之間有著較強(qiáng)的關(guān)聯(lián)性,主成分可以有效的提取出信息。確保主成分可以提取出研究項大部分的信息量之后,接著分析主成分和研究項的對應(yīng)關(guān)系情況(載荷系數(shù)絕對值大于0.4時即說明該項和主成分有對應(yīng)關(guān)系)。

補(bǔ)充說明:如果主成分分析結(jié)果不佳,可考慮使用因子分析,在主成分分析的基礎(chǔ)上,因子分析多出旋轉(zhuǎn)功能,更容易找出因子和分析項對應(yīng)關(guān)系。

4.成份得分系數(shù)矩陣

使用主成分分析目的在于信息濃縮,則忽略“成份得分系數(shù)矩陣”表格。如果使用主成分分析法進(jìn)行權(quán)重計算,則需要使用“成份得分系數(shù)矩陣”建立主成分和研究項之間的關(guān)系等式(基于標(biāo)準(zhǔn)化后數(shù)據(jù)建立關(guān)系表達(dá)式),如下:

成分得分1(成分1)=

0.151*X1+0.142*X2+0.150*X3+0.162*X4+0.152*X5+0.147*X6+0.134*X7+0.142*X8+0.154*X9;
成分得分2(成分2)=

-0.076*X1-0.205*X2-0.097*X3-0.090*X4-0.387*X5-0.498*X6+0.101*X7+0.823*X8+0.463*X9;

5.碎石圖

可結(jié)合碎石圖輔助判斷主成分提取個數(shù)。當(dāng)折線由陡峭突然變得平穩(wěn)時,陡峭到平穩(wěn)對應(yīng)的主成分個數(shù)即為參考提取主成分個數(shù)。實際研究中更多以專業(yè)知識,結(jié)合主成分與研究項對應(yīng)關(guān)系情況,綜合權(quán)衡判斷得出主成分個數(shù)。圖中可以看出當(dāng)橫坐標(biāo)為2時,折線突然變得比較平穩(wěn)。

6.載荷圖

載荷圖是針對成分與旋轉(zhuǎn)后載荷值關(guān)系的圖形化展示,使用較少,通常需要手工加‘圓圈’把挨在一起的因子圈起來,更直觀展示成分與分析項的隸屬對應(yīng)關(guān)系情況。由于可讀性和解釋性問題,一般只關(guān)注于方差解釋率靠前的前面幾個成分,多數(shù)情況下只關(guān)注2個。

7.線性組合系數(shù)及權(quán)重結(jié)果

SPSSAU的主成分分析結(jié)果中默認(rèn)提供“線性組合系數(shù)及權(quán)重結(jié)果表”包括上述的過程值及結(jié)果,包括線性組合系數(shù)、綜合得分系數(shù)、以及指標(biāo)各自的權(quán)重。

6.綜合得分排名

根據(jù)之前勾選的“綜合得分”,即可自動得到綜合得分結(jié)果。

SPSSAU默認(rèn)命名為CompScore_XXXX。使用【數(shù)據(jù)處理】→【標(biāo)題處理】功能可以對題目重命名。

【數(shù)據(jù)處理】→【生成變量】里的排名功能。點擊“綜合得分”,再選擇“排名(Rank)”,點擊確認(rèn)處理。

右上角“我的數(shù)據(jù)”也可以將數(shù)據(jù)進(jìn)行下載。

其它說明

1. 提示出現(xiàn)奇異矩陣?

如果提示出現(xiàn)“奇異矩陣”,通常情況下由于分析樣本量太少(比如分析項有20個,分析樣本僅10個),此里需要加大樣本量或者減少分析項即可;以及還有一種情況是分析項之間的相關(guān)性非常非常弱或者非常非常強(qiáng),此時需要移除掉相關(guān)性非常弱或者非常強(qiáng)的分析項(使用相關(guān)分析進(jìn)行檢查相關(guān)關(guān)系)。

2. ‘分析之前是否需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理’?

SPSSAU默認(rèn)就已經(jīng)進(jìn)行過標(biāo)準(zhǔn)化處理,因此不需要再對數(shù)據(jù)處理。當(dāng)然標(biāo)準(zhǔn)化后的數(shù)據(jù)再次標(biāo)準(zhǔn)化依舊還是自身沒有任何變化,結(jié)果永遠(yuǎn)均一致。

3.綜合得分如何使用?

SPSSAU默認(rèn)可保存綜合得分(以及因子得分等);一般該值越大表示越有競爭力等;研究者通常需要把綜合得分的具體數(shù)據(jù)下載后使用,并且在EXCEL進(jìn)行排序(也可使用SPSSAU生成變量里面的排序功能)。 通過右上角我的數(shù)據(jù)可下載具體綜合得分的具體數(shù)據(jù)等。

4.特征根值沒有大于1可以嗎?

主成分分析時通常需要綜合自己的專業(yè)知識,以及軟件結(jié)果進(jìn)行綜合判斷,即使是特征根值小于1,也一樣可以提取主成分。

5.主成分回歸是什么意思?

進(jìn)行主成分時,選擇保存‘成分得分’,然后利用系統(tǒng)生成的‘成分得分’數(shù)據(jù)進(jìn)行線性回歸,即為主成分回歸。

6.累積方差解釋率出現(xiàn)100%以上如何辦?

正常情況下,累積方差解釋率會小于100%,但如果數(shù)據(jù)的共線性問題太嚴(yán)重,有可能出現(xiàn)方差解釋率值大于100%,此時建議進(jìn)行相關(guān)分析,找出相關(guān)性太強(qiáng)(比如相關(guān)系數(shù)大于0.8)的項,然后從分析框中移出后再次分析。與此同時,如果樣本量太少也可能出現(xiàn)此問題建議加大樣本量即可。

7. KMO值過低?

一般需要KMO值大于0.6即可,如果是兩個分析項,KMO值一定是0.5;因而建議刪除掉共同度(公因子方差)值較低項,這樣可以提升KMO值。

如果不輸出KMO值,意味著數(shù)據(jù)質(zhì)量過差,建議可使用相關(guān)分析看下相關(guān)關(guān)系,如果相關(guān)系數(shù)值基本均小于0.3(或者沒有呈現(xiàn)出顯著性),則說明題項間關(guān)聯(lián)性弱,則KMO值一定會較低,建議先移除相關(guān)系數(shù)值較低項后再次分析。

提示:KMO值綜合衡量分析項間的信息重疊情況(即分析項之間的相關(guān)關(guān)系情況)。分析項之間的相關(guān)系數(shù)過低(比如小于0.2或沒有顯著性),信息重疊度低無法有效濃縮信息,這會導(dǎo)致KMO值較低,如果分析項之間的相關(guān)系數(shù)過高(比如大于0.8),這會導(dǎo)致嚴(yán)重共線性可能無法輸出KMO值。分析項之間的相關(guān)系數(shù)值一般希望介于0.3~0.7之間較好。

總結(jié)

主成分分析的原理在于信息濃縮,對于信息濃縮的幫助越大,指標(biāo)權(quán)重可越大,正是利用此原理,可進(jìn)行指標(biāo)權(quán)重的計算。主成分分析的作用更多側(cè)重于計算權(quán)重、計算綜合競爭力。不會過多關(guān)注主成分與分析項對應(yīng)關(guān)系,不要求每個主成分有明確的含義。

「SPSSAU|數(shù)據(jù)分析」:主成分分析步驟匯總的評論 (共 條)

分享到微博請遵守國家法律
河东区| 哈尔滨市| 密云县| 华坪县| 大厂| 高阳县| 蒙自县| 昭平县| 商丘市| 黑龙江省| 绥宁县| 敦化市| 屯留县| 景谷| 自贡市| 如东县| 和平区| 义乌市| 和静县| 任丘市| 来宾市| 红安县| 乌鲁木齐县| 乾安县| 北票市| 运城市| 湘潭县| 闻喜县| 平顺县| 宣武区| 平和县| 水城县| 昔阳县| 连山| 北海市| 巴马| 榆林市| 二连浩特市| 西和县| 兴海县| 法库县|