「SPSSAU|數(shù)據(jù)分析」:主成分計(jì)算權(quán)重
案例背景
案例說明與研究目的
研究調(diào)查100家公司2010-2013年關(guān)于財(cái)務(wù)方面的具體數(shù)據(jù),這些財(cái)務(wù)指標(biāo)維度分別為盈利能力、償債能力、運(yùn)營能力、發(fā)展能力以及公司治理。其中每個(gè)維度分別有幾個(gè)分析項(xiàng),但是有些指標(biāo)是越大越好,有些指標(biāo)是越小越好。 需要在研究前進(jìn)行數(shù)據(jù)處理。
想要調(diào)查的數(shù)據(jù)進(jìn)行主成分分析,判斷主成分與分析項(xiàng)之間的關(guān)系得到相應(yīng)維度,對(duì)于二級(jí)指標(biāo)使用熵值法進(jìn)行求取權(quán)重,一級(jí)指標(biāo)由主成分分析得到的相應(yīng)維度進(jìn)行計(jì)算權(quán)重,最后匯總總結(jié)。
數(shù)據(jù)處理與SPSSAU操作
主成分的目的就是用少數(shù)幾個(gè)成分去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個(gè)變量歸在同一類中,每一類變量就成為一個(gè)成分(之所以稱其為成分,是因?yàn)樗遣豢捎^測(cè)的,即不是具體的變量),以最少的信息丟失為前提,以較少的幾個(gè)成分反映原資料的大部分信息。
在進(jìn)行主成分之前,由于所選取的指標(biāo)體系中每個(gè)指標(biāo)都有自己的量綱和變動(dòng)差異性,這樣給綜合分析建模帶來不便,于是我們需要對(duì)收集得到的數(shù)據(jù)進(jìn)行預(yù)處理,以消除量綱和變動(dòng)差異性的影響。通常對(duì)數(shù)據(jù)進(jìn)行的處理包括標(biāo)準(zhǔn)化處理(Z-score 法)、正向處理、均值化處理等。
此案例中有些指標(biāo)需要提前處理,具體指標(biāo)隸屬維度以及指標(biāo)性質(zhì)如下,比如資產(chǎn)負(fù)責(zé)率是逆向指標(biāo)可以進(jìn)行逆向化處理或者取倒數(shù);但是取倒數(shù)需要分析項(xiàng)的數(shù)據(jù)大于0,其他指標(biāo)需要正向化處理,公司治理的2個(gè)指標(biāo)可以做正向化處理也可以做適度化,比如認(rèn)為指標(biāo)不是越大越好也不是越小越好,接近于某個(gè)值或某個(gè)范圍內(nèi)認(rèn)為更好那就使用適度化,此案例中認(rèn)為越大越好處理為正向化(也有參考文獻(xiàn)做適度化處理,建議以參考文獻(xiàn)為主)。
1.描述分析
首先用SPSSAU將分析項(xiàng)進(jìn)行“描述分析”觀察數(shù)據(jù)的基本情況。發(fā)現(xiàn)資產(chǎn)負(fù)債率所有數(shù)據(jù)均大于0,所以進(jìn)行處理時(shí)可以直接“取倒數(shù)”。
2.數(shù)據(jù)處理
然后利用SPSSAU“數(shù)據(jù)處理”中的“生成變量”進(jìn)行指標(biāo)處理(一般正逆向化處理后不需要在進(jìn)行標(biāo)準(zhǔn)化處理,因?yàn)橐呀?jīng)正逆向化已經(jīng)處理了量綱問題,但是取倒數(shù)后需要進(jìn)行標(biāo)準(zhǔn)化處理)。
3.主成分分析
因?yàn)榘咐念A(yù)設(shè)維度為5所以將分析項(xiàng)拖拽到右側(cè)分析框后,下拉選擇成分個(gè)數(shù)為5。
主成分結(jié)果
1.判斷主成分與分析項(xiàng)對(duì)應(yīng)關(guān)系
使用主成分分析進(jìn)行信息濃縮研究,首先分析研究數(shù)據(jù)是否適合進(jìn)行主成分分析,從上表可以看出:KMO為0.642,大于0.6,滿足主成分分析的前提要求,意味著數(shù)據(jù)可用于主成分分析研究。以及數(shù)據(jù)通過Bartlett 球形度檢驗(yàn)(p<0.05),說明研究數(shù)據(jù)適合進(jìn)行主成分分析。
成分與對(duì)應(yīng)項(xiàng)之間的關(guān)系:
一般情況下,如果16項(xiàng)與5個(gè)成分之間的對(duì)應(yīng)關(guān)系情況,與專業(yè)知識(shí)情況不符合,比如第一項(xiàng)被劃分到了第一個(gè)主成分下面,此時(shí)則說明可能這項(xiàng)應(yīng)該被刪除處理,其出現(xiàn)了‘張冠李戴’現(xiàn)象。因而在進(jìn)行分析時(shí)很可能會(huì)對(duì)部分不合理項(xiàng)進(jìn)行刪除處理。除此之外,也有可能會(huì)出現(xiàn)‘糾纏不清’現(xiàn)象。
“張冠李戴”
一般情況下,如果16項(xiàng)與5個(gè)成分之間的對(duì)應(yīng)關(guān)系情況,與專業(yè)知識(shí)情況不符合,比如第一項(xiàng)被劃分到了第一個(gè)主成分下面,此時(shí)則說明可能這項(xiàng)應(yīng)該被刪除處理,其出現(xiàn)了‘張冠李戴’現(xiàn)象。例如案例中的“應(yīng)收賬款周轉(zhuǎn)率”應(yīng)該屬于成分2是分析時(shí)被劃分到別的成分中。
“糾纏不清”
除了“張冠李戴”現(xiàn)象,有時(shí)候會(huì)出現(xiàn)‘糾纏不清’現(xiàn)象,比如案例中的“凈資產(chǎn)收益率”可歸屬為成分1,成分2,同時(shí)也可歸屬到成分3,這種情況較為正常(稱作‘糾纏不清’),需要結(jié)合實(shí)際情況處理即可,可將該項(xiàng)刪除,也可不刪除,這時(shí),分析帶有一定主觀性。
主成分分析是一個(gè)多次重復(fù)的過程,比如刪除某個(gè)或多個(gè)題項(xiàng)后,則需要重新再次分析進(jìn)行對(duì)比選擇等。最終目的在于:成分與分析項(xiàng)對(duì)應(yīng)關(guān)系,與專業(yè)知識(shí)情況基本吻合。
Step1: 第一次分析
本例子中共16個(gè)分析項(xiàng),此16個(gè)分析項(xiàng)共分為5個(gè)維度,因此在分析前可主動(dòng)告訴SPSSAU,此16項(xiàng)是五個(gè)維度,否則SPSSAU會(huì)自動(dòng)判斷多少個(gè)成分 (通常軟件自動(dòng)判斷與實(shí)際情況有很大出入,所以建議主動(dòng)設(shè)置成分個(gè)數(shù))。如下圖:
從上圖中可以看出:
“流動(dòng)比率”、“速動(dòng)比率”以及“資產(chǎn)負(fù)債率”這3項(xiàng),它們?nèi)繉?duì)應(yīng)著成分1,共同度均高于0.4,說明此3項(xiàng)應(yīng)該同屬于一個(gè)維度,即邏輯上這3項(xiàng),并沒有出現(xiàn) “張冠李戴”現(xiàn)象。但是有出現(xiàn)“糾纏不清”的情況。暫不處理。
“應(yīng)收賬款周轉(zhuǎn)率”、“存貨周轉(zhuǎn)率”、“總資產(chǎn)周轉(zhuǎn)率”它們對(duì)應(yīng)著成分2,但應(yīng)收賬款周轉(zhuǎn)率共同度小于0.4所以需要?jiǎng)h除處理。
“凈資產(chǎn)收益率”、“資產(chǎn)報(bào)酬率”以及“主營業(yè)務(wù)利潤(rùn)率”共3項(xiàng),此3項(xiàng)均對(duì)應(yīng)著成分3,此3項(xiàng)并沒有出現(xiàn)‘張冠李戴’問題,但是出現(xiàn)了“糾纏不清”。
“第一大股東持股比”和“前十大股東持股比”共2項(xiàng),它們?nèi)繉?duì)應(yīng)著成分4,也沒有出現(xiàn)“糾纏不清”的現(xiàn)象。
“凈利潤(rùn)增長(zhǎng)率”、“主營業(yè)務(wù)收入增長(zhǎng)率”、“總資產(chǎn)現(xiàn)金回收率”、“銷售現(xiàn)金比率”以及“每股經(jīng)營性現(xiàn)金流量”共5項(xiàng),當(dāng)他們對(duì)應(yīng)成分5, “主營業(yè)務(wù)收入增長(zhǎng)率”、“總資產(chǎn)現(xiàn)金回收率”以及“每股經(jīng)營性現(xiàn)金流量”出現(xiàn)“張冠李戴”進(jìn)行刪除處理。
總結(jié)上述分析可知:“主營業(yè)務(wù)收入增長(zhǎng)率”、“總資產(chǎn)現(xiàn)金回收率”以及“每股經(jīng)營性現(xiàn)金流量”這三項(xiàng)出現(xiàn)“張冠李戴”,應(yīng)該將此三項(xiàng)刪除;“應(yīng)收賬款周轉(zhuǎn)率”共同度小于0.4需要?jiǎng)h除處理,而其他出現(xiàn)“糾纏不清”現(xiàn)象的,暫時(shí)不處理(進(jìn)行關(guān)注即可)。重新分析如下。
Step2: 第二次分析
從上圖可知 “主營業(yè)務(wù)利潤(rùn)率”出現(xiàn)‘張冠李戴’現(xiàn)象,應(yīng)該刪除,以及“資產(chǎn)收益率”、“資產(chǎn)報(bào)酬率”等出現(xiàn)‘糾纏不清’現(xiàn)象,暫不處理,但應(yīng)該給予關(guān)注??偨Y(jié)可知:應(yīng)該將“主營業(yè)務(wù)利潤(rùn)率”先刪除后再次進(jìn)行第3次分析。
Step3: 第三次分析
將“主營業(yè)務(wù)利潤(rùn)率”刪除后進(jìn)行分析如下:
從上圖可知
除了“流動(dòng)比率”、“速動(dòng)比率”以及“資產(chǎn)負(fù)債率”這3項(xiàng),“凈利潤(rùn)增長(zhǎng)率”、“銷售現(xiàn)金比率”這兩項(xiàng),其余的項(xiàng)均存在“糾纏不清”的現(xiàn)象,但考慮到成分下只余下兩項(xiàng),因而表示可以接受,主成分析分析結(jié)束。
2.KMO值和巴特球形檢驗(yàn)
使用主成分分析進(jìn)行信息濃縮研究,首先分析研究數(shù)據(jù)是否適合進(jìn)行主成分分析,從上表可以看出:KMO為0.605,大于0.6,滿足主成分分析的前提要求,意味著數(shù)據(jù)可用于主成分分析研究。以及數(shù)據(jù)通過Bartlett 球形度檢驗(yàn)(p<0.05),說明研究數(shù)據(jù)適合進(jìn)行主成分分析。
3.成分選擇個(gè)數(shù)與提取成分
當(dāng)數(shù)據(jù)確定可以使用主成分分析后,下一步確定主成分成分選擇個(gè)數(shù)。
上表格針對(duì)主成分提取情況,以及主成分提取信息量情況進(jìn)行分析,從上表可知:主成分分析一共提取出5個(gè)主成分,特征根值均大于1,此5個(gè)主成分的方差解釋率分別是29.083%,18.253%,14.734%,12.376%,11.033%,累積方差解釋率為85.479%。(提示:如果主成分提取個(gè)數(shù)與預(yù)期不符,可在分析時(shí)主動(dòng)設(shè)置主成分個(gè)數(shù))。另外,本次分析共提取出5個(gè)主成分,它們對(duì)應(yīng)的加權(quán)后方差解釋率即權(quán)重依次為:29.083/85.479=34.02%;18.253/85.479=21.35%;14.734/85.479=17.24%;12.376/85.479=14.48%;11.033/85.479=12.91%;同時(shí)SPSSAU還提供了碎石圖幫助研究者判斷主成分提取個(gè)數(shù)。
已經(jīng)確定了成分選擇個(gè)數(shù)經(jīng)過分析得到載荷系數(shù)矩陣如下:
從結(jié)果中可以看出,主成分1中反映“流動(dòng)比率”、“速動(dòng)比率”以及“資產(chǎn)負(fù)債率”共3個(gè)指標(biāo)的信息,它們主要反映了公司的償債能力。主成分2中反映了“凈資產(chǎn)收益率”、“資產(chǎn)報(bào)酬率”共2項(xiàng)它們主要反映了公司的盈利能力,主成分3中反映了“第一大股東持股比”和“前十大股東持股比”共2項(xiàng),它們主要反映了公司治理能力,主成分4中反映了“存貨周轉(zhuǎn)率”、“總資產(chǎn)周轉(zhuǎn)率”共2項(xiàng),它們主要反映了公司運(yùn)營能力,主成分5中反映了“凈利潤(rùn)增長(zhǎng)率”、 “銷售現(xiàn)金比率”,它們主要反映了公司發(fā)展能力。
整理表格如下:五個(gè)成分的名字分別叫F1償債能力、F2盈利能力、F3治理能力、F4運(yùn)營能力以及F5發(fā)展能力。
4.一級(jí)指標(biāo)權(quán)重計(jì)算
利用方差解釋率歸一化得到各個(gè)維度的權(quán)重:成分1權(quán)重:0.291/0.855=0.340;成分2權(quán)重:0.183/0.855=0.214;成分3權(quán)重:0.147/0.855=0.172,成分4權(quán)重0.124/0.855=0.145,成分5權(quán)重0.110/0.855=0.083。
到此,主成分分析結(jié)束,上述主成分分析的目的是進(jìn)行判斷主成分與分析項(xiàng)之間關(guān)系,進(jìn)行重復(fù)分析,刪除不滿足分析的分析項(xiàng),描述相應(yīng)的五個(gè)維度,利用方差解釋率計(jì)算五個(gè)一級(jí)指標(biāo)的權(quán)重。接下來利用SPSSAU熵值法計(jì)算二級(jí)指標(biāo)權(quán)重得到權(quán)重后進(jìn)行最后的權(quán)重計(jì)算。
熵值法計(jì)算二級(jí)指標(biāo)權(quán)重
1.二級(jí)指標(biāo)權(quán)重結(jié)果
將主成分分析確定的最終11個(gè)二級(jí)指標(biāo)利用SPSSAU進(jìn)行熵值法,因?yàn)?/strong>11項(xiàng)是五個(gè)維度下的指標(biāo)所以重復(fù)進(jìn)行五次熵值法分析,得到償債能力二級(jí)指標(biāo)的權(quán)重如下:
使用熵值法對(duì)MMS_流動(dòng)比率等總共3項(xiàng)進(jìn)行權(quán)重計(jì)算,從上表可以看出:MMS_流動(dòng)比率, MMS_速動(dòng)比率, S_Reciprocal_資產(chǎn)負(fù)債率總共3項(xiàng),它們的權(quán)重值分別是0.289, 0.353, 0.358。并且各項(xiàng)間的權(quán)重相對(duì)較為均勻,均在0.333附近。
盈利能力的二級(jí)指標(biāo)權(quán)重如下:
使用熵值法對(duì)MMS_凈資產(chǎn)收益率等總共2項(xiàng)進(jìn)行權(quán)重計(jì)算,從上表可以看出:MMS_凈資產(chǎn)收益率, MMS_資產(chǎn)報(bào)酬率總共2項(xiàng),它們的權(quán)重值分別是0.066, 0.934。各項(xiàng)間的權(quán)重大小有著一定的差異,其中MMS_資產(chǎn)報(bào)酬率這項(xiàng)的權(quán)重最高為0.934,以及MMS_凈資產(chǎn)收益率這項(xiàng)的權(quán)重最低為0.066。
治理能力的二級(jí)指標(biāo)權(quán)重計(jì)算:
用熵值法對(duì)MMS_第一大股東持股比等總共2項(xiàng)進(jìn)行權(quán)重計(jì)算,從上表可以看出:MMS_第一大股東持股比, MMS_前十大股東持股比總共2項(xiàng),它們的權(quán)重值分別是0.577, 0.423。并且各項(xiàng)間的權(quán)重相對(duì)較為均勻,均在0.500附近。
運(yùn)營能力的二級(jí)指標(biāo)權(quán)重計(jì)算
使用熵值法對(duì)MMS_存貨周轉(zhuǎn)率等總共2項(xiàng)進(jìn)行權(quán)重計(jì)算,從上表可以看出:MMS_存貨周轉(zhuǎn)率, MMS_總資產(chǎn)周轉(zhuǎn)率總共2項(xiàng),它們的權(quán)重值分別是0.599, 0.401。并且各項(xiàng)間的權(quán)重相對(duì)較為均勻,均在0.500附近。
發(fā)展能力的二級(jí)指標(biāo)權(quán)重計(jì)算
使用熵值法對(duì)MMS_凈利潤(rùn)增長(zhǎng)率等總共2項(xiàng)進(jìn)行權(quán)重計(jì)算,從上表可以看出:MMS_凈利潤(rùn)增長(zhǎng)率, MMS_銷售現(xiàn)金比率總共2項(xiàng),它們的權(quán)重值分別是0.121, 0.879。各項(xiàng)間的權(quán)重大小有著一定的差異,其中MMS_銷售現(xiàn)金比率這項(xiàng)的權(quán)重最高為0.879,以及MMS_凈利潤(rùn)增長(zhǎng)率這項(xiàng)的權(quán)重最低為0.121。
2.最終權(quán)重結(jié)果
比如,計(jì)算出一級(jí)指標(biāo)權(quán)重分別為0.340、0.214、0.172、0.145以及0.083。二級(jí)指標(biāo)流動(dòng)比率權(quán)重為0.289,則流動(dòng)比率最終權(quán)重值為0.340*0.289=0.098。根據(jù)權(quán)重結(jié)果可以發(fā)現(xiàn)“償債能力”占比較大在公司決策時(shí)可以重點(diǎn)關(guān)注。
總結(jié)
本篇文章主要利用主成分分析計(jì)算權(quán)重,首先對(duì)數(shù)據(jù)進(jìn)行處理,處理后對(duì)用SPSSAU進(jìn)行主成分分析,首先判斷數(shù)據(jù)是否滿足主成分分析要求,發(fā)現(xiàn)數(shù)據(jù)滿足主成分分析要求,然后判斷主成分與分析項(xiàng)對(duì)應(yīng)關(guān)系。進(jìn)行刪除與修改,重新分析后描述成分選擇個(gè)數(shù)與提取成分由于本篇文章重點(diǎn)講主成分計(jì)算權(quán)重,所以對(duì)二者進(jìn)行簡(jiǎn)單說明,利用方差解釋率計(jì)算各個(gè)一級(jí)指標(biāo)的權(quán)重,在利用熵值法計(jì)算二級(jí)指標(biāo)的權(quán)重,因?yàn)橛形鍌€(gè)維度所以進(jìn)行五次熵值法分析,最后求得最終權(quán)重。