經(jīng)管畢業(yè)論文常用主成分分析(PCA)

? ? ? ?大家好,今天給大家再介紹一種經(jīng)濟管理中畢業(yè)論文(設計)中常用的一種方法——主成分分析法

(1)是什么
? ? ? ?主成分分析(Principal Component Analysis,PCA),也有別稱:主分量分析、矩陣數(shù)據(jù)分析
? ? ? 它利用數(shù)理統(tǒng)計方法找出系統(tǒng)中的主要因素和各因素之間的相互關(guān)系,由于系統(tǒng)的相互關(guān)聯(lián)性,當出現(xiàn)異常情況時或?qū)ο到y(tǒng)進行分析時,抓住幾個主要參數(shù)的狀態(tài),就能把握系統(tǒng)的全局。這幾個參數(shù)反映了問題的綜合指標,也是系統(tǒng)的主要因素。
? ? ?不太好理解對吧,實際就是:在生活中,為全面分析問題,一般把和這個問題有關(guān)的因素都找出來,這些因素多多少少都會反映這個問題的一些信息,而且這些因素多多少少還會有點相關(guān)性,但是因素太多就是分析問題起太**復雜性。
? ? ? 所以就有了這個方法——PCA,目的就是把太多的因素組成彼此之間沒關(guān)系的新變量。并且盡量多保留原來的信息。?

? 給大家舉個例子:粉色的因素可以描述這個橢圓95%,但是因素之間可能有關(guān)系而且這么多不好描述,然后把這堆因素轉(zhuǎn)化成兩個因素分別是PC1和PC2,但是只能表達橢圓的90%,你看PC1與PC2是垂直的,所以這兩個是相互獨立的沒關(guān)系的,其次才兩個,是不是很好表達這個橢圓。
(2)為什么
? ? ? ? ?為啥要用這個?這個問題也可以回答這個有啥用?
□主成分分析能降低所研究數(shù)據(jù)空間的維數(shù)。即用研究 q 維的Y空間代替p 維的 X空間(q<p),而低維的Y空間代替高維的X空間所損失的信息很少。
□有時可通過因子負荷的結(jié)論,弄清變量間的某些關(guān)系。
□多維數(shù)據(jù)的一種圖形表示方法。當維數(shù)大于3時便不能畫出幾何圖形,經(jīng)過主成分分析后,可以選取前兩個主成分或其中某兩個主成分,畫出在二維平面上的分布狀況。
? ? ? ? ?不太好理解,說簡單一點:可以用在因子分析、系統(tǒng)評價,最常用的就是用在評價。

(3)怎么做
? ? ?假設數(shù)據(jù)樣本等于n,每個樣本都有p個變量,那么就構(gòu)成了一個n×p階矩陣,如式(1)所示的線性方程組:?

?在式(1)的n×p階矩陣中,當p值較大時,空間維度較大,分析問題較為復雜。利用線性關(guān)系降維后,提取幾個綜合指標(主成分)代替原來較多的變量指標。具體方法為取原變量的線性組合,經(jīng)過對組合系數(shù)的調(diào)整,使新的變量間的代表性和相互獨立性最好。設原變量指標為X1、X2、…、Xp,它們的綜合指標為Z1、Z2、…、Zm(m≤p),則可得到如式(2)所示的線性方程組:?

? ? ? 其中:Zi與Zj(i≠j;i、j=1,2,…,m)相互無關(guān)。Z1是X1、X2、…、Xp的一切線性組合中方差最大者,Z2是與Z1不相關(guān)的X1、X2、…、Xp的所有線性組合中方差最大者;Zm是與Z1、Z2、…、Zm-1都不相關(guān)的X1、X2、…、Xp的所有線性組合中方差最大者。所得的新變量Z1、Z2、…、Zm分別為原變量指標X1、X2、…、Xp的第一、第二…第m主成分。其中,Z1在總方差中的貢獻率最大,Z2、Z3、…、Zm的方差貢獻率依次遞減。一般選取方差貢獻率較大的幾個主成分,減少變量的數(shù)目,簡化變量之間的關(guān)系。主成分就是確定原變量Xj(j=1,2,…,p),在各主成分Zi(i=1,2,…,m)上的載荷Lij(i=1,2,…,m;j=1,2,…,p)。根據(jù)線性代數(shù)可知,它們是相關(guān)矩陣X1、X2、…、Xp的m個較大特征值所對應的特征向量。
注意:
? ? ? 因子分析法與主成分分析法都是基于統(tǒng)計分析法,但二者有較大的區(qū)別。主成分分析法是通過坐標變換提取主成分,也就是將一組具有相關(guān)性的變量變換為一組獨立的變量,將主成分表示為原始觀察變量的線性組合。而因子分析法是要構(gòu)造因子模型將原始觀察變量分解為因子的線性組合。所以,因子分析法是主成分分析法的發(fā)展。?
參考文獻
[1]基于主成分分析的中學生研學旅游需求動機研究——以太原市為例[J].經(jīng)濟問題,2016,No.443(07):119-124.DOI:10.16011/j.cnki.jjwt.2016.07.023.?