最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

R語言、SPSS基于主成分PCA的中國城鎮(zhèn)居民消費(fèi)結(jié)構(gòu)研究可視化分析

2023-02-09 23:26 作者:拓端tecdat  | 我要投稿

全文鏈接:http://tecdat.cn/?p=31563

原文出處:拓端數(shù)據(jù)部落公眾號

以全國31個省、市、自治區(qū)的城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出的食品、衣著、居住、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通與通訊、娛樂教育文化服務(wù)、其它商品和服務(wù)等 8 個指標(biāo)數(shù)據(jù)為依據(jù), 利用SPSS和R統(tǒng)計(jì)軟件, 采用主成分分析法對當(dāng)前城鎮(zhèn)居民消費(fèi)結(jié)構(gòu)進(jìn)行分析, 結(jié)果顯示: 娛樂教育文化服務(wù)、交通通訊、家庭設(shè)備用品、居住、食品是影響消費(fèi)大小變動的主要因素, 而衣著、醫(yī)療保健、居住、食品是影響消費(fèi)結(jié)構(gòu)變動的主要因素; 各省市城鎮(zhèn)居民消費(fèi)大小與其經(jīng)濟(jì)發(fā)達(dá)程度密切相關(guān); 相鄰省市消費(fèi)結(jié)構(gòu)比較相似; 沿海地區(qū)與內(nèi)地消費(fèi)結(jié)構(gòu)有較大的差別

第一步:錄入或調(diào)入數(shù)據(jù)

第二步:打開“因子分析”對話框。?

沿著主菜單的“Analyze→Data?Reduction→Factor?”的路徑(圖2)打開因子分析選項(xiàng)框

第三步:選項(xiàng)設(shè)置。?

首先,在源變量框中選中需要進(jìn)行分析的變量,點(diǎn)擊右邊的箭頭符號,將需要的變量調(diào)入變量(Variables)欄中(圖3)。在本例中,全部8個變量都要用上,故全部調(diào)入(圖4)。因無特殊需要,故不必理會“Value?”欄。下面逐項(xiàng)設(shè)置

?

⒈?設(shè)置Descriptives選項(xiàng)。?

單擊Descriptives按鈕(圖4),彈出Descriptives對話框(圖5)。

在Statistics欄中選中Univariate?descriptives復(fù)選項(xiàng),則輸出結(jié)果中將會給出原始數(shù)據(jù)的抽樣均值、方差和樣本數(shù)目(這一欄結(jié)果可供檢驗(yàn)參考);選中Initial?solution復(fù)選項(xiàng),則會給出主成分載荷的公因子方差(這一欄數(shù)據(jù)分析時(shí)有用)。?

在Correlation?Matrix欄中,選中Coefficients復(fù)選項(xiàng),則會給出原始變量的相關(guān)系數(shù)矩陣(分析時(shí)可參考);選中Determinant復(fù)選項(xiàng),則會給出相關(guān)系數(shù)矩陣的行列式,如果希望在Excel中對某些計(jì)算過程進(jìn)行了解,可選此項(xiàng),否則用途不大。其它復(fù)選項(xiàng)一般不用,但在特殊情況下可以用到(本例不選)。?

設(shè)置完成以后,單擊Continue按鈕完成設(shè)置(圖5)。

設(shè)置Extraction選項(xiàng)。?

打開Extraction對話框(圖6)。因子提取方法主要有7種,在Method欄中可以看到,系統(tǒng)默認(rèn)的提取方法是主成分(????????????????????),因此對此欄不作變動,就是認(rèn)可了主成分分析方法。?

在Analyze欄中,選中Correlation?matirx復(fù)選項(xiàng),則因子分析基于數(shù)據(jù)的相關(guān)系數(shù)矩陣進(jìn)行分析;如果選中Covariance?matrix復(fù)選項(xiàng),則因子分析基于數(shù)據(jù)的協(xié)方差矩陣進(jìn)行分析。對于主成分分析而言,由于數(shù)據(jù)標(biāo)準(zhǔn)化了,這兩個結(jié)果沒有分別,因此任選其一即可。?

在Display欄中,選中Unrotated?factor?solution(非旋轉(zhuǎn)因子解)復(fù)選項(xiàng),則在分析結(jié)果中給出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。對于主成分分析而言,這一項(xiàng)選擇與否都一樣;對于旋轉(zhuǎn)因子分析,選擇此項(xiàng),可將旋轉(zhuǎn)前后的結(jié)果同時(shí)給出,以便對比。?

選中Scree?Plot(“山麓”圖),則在分析結(jié)果中給出特征根按大小分布的折線圖(形如山麓截面,故得名),以便我們直觀地判定因子的提取數(shù)量是否準(zhǔn)確。

主成分計(jì)算是利用迭代(Iterations)方法,系統(tǒng)默認(rèn)的迭代次數(shù)是25次。但是,當(dāng)數(shù)據(jù)量較大時(shí),25次迭代是不夠的,需要改為50次、100次乃至更多。對于本例而言,變量較少,25次迭代足夠,故無需改動。

?

設(shè)置Scores設(shè)置。?

選中Save?as?variables欄,則分析結(jié)果中給出標(biāo)準(zhǔn)化的主成分得分(在數(shù)據(jù)表的后面)。至于方法復(fù)選項(xiàng),對主成分分析而言

選中Display?factor?score?coefficient?matrix,則在分析結(jié)果中給出因子得分系數(shù)矩陣及其相關(guān)矩陣。?

??

?

選中Display?factor?score?coefficient?matrix,則在分析結(jié)果中給出因子得分系數(shù)矩陣及其相關(guān)矩陣。?

?其它。?

對于主成分分析而言,旋轉(zhuǎn)項(xiàng)(Rotation)可以不必設(shè)置;對于數(shù)據(jù)沒有缺失的情況下,Option項(xiàng)可以不必理會。

Correlation Matrixa??消費(fèi)支出食品煙酒衣著居住生活用品及服務(wù)交通通信教育文化娛樂醫(yī)療保健其他用品及服務(wù)Correlation消費(fèi)支出1.000.873.499.960.838.872.860.715.906食品煙酒.8731.000.262.811.663.755.620.396.751衣著.499.2621.000.377.646.424.355.606.649居住.960.811.3771.000.774.761.825.657.861生活用品及服務(wù).838.663.646.7741.000.685.730.608.804交通通信.872.755.424.761.6851.000.774.624.727教育文化娛樂.860.620.355.825.730.7741.000.735.743醫(yī)療保健.715.396.606.657.608.624.7351.000.694其他用品及服務(wù).906.751.649.861.804.727.743.6941.000a. Determinant = 1.69E-014

Correlation?Matrix(相關(guān)系數(shù)矩陣),一般而言,相關(guān)系數(shù)高的變量,大多會進(jìn)入同一個主成分,但不盡然,除了相關(guān)系數(shù)外,決定變量在主成分中分布地位的因素還有數(shù)據(jù)的結(jié)構(gòu)。相關(guān)系數(shù)矩陣對主成分分析具有參考價(jià)值,畢竟主成分分析是從計(jì)算相關(guān)系數(shù)矩陣的特征根開始的。

?

在Communalities(公因子方差)中,給出了因子載荷陣的初始公因子方差(Initial)和提取公因子方差(Extraction)

Communalities?InitialExtraction消費(fèi)支出1.000.975食品煙酒1.000.659衣著1.000.362居住1.000.860生活用品及服務(wù)1.000.770交通通信1.000.754教育文化娛樂1.000.764醫(yī)療保健1.000.605其他用品及服務(wù)1.000.864Extraction Method: Principal Component Analysis.

在Total?Variance?Explained(全部解釋方差)?表的Initial?Eigenvalues(初始特 ?7? 征根)中,給出了按順序排列的主成分得分的方差(Total),在數(shù)值上等于相關(guān)系數(shù)矩陣的各個特征根λ,因此可以直接根據(jù)特征根計(jì)算每一個主成分的方差百分比(%?of?Variance)。

Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %16.61373.47973.4796.61373.47973.4792.99211.02784.506???3.5556.16290.668???4.2983.31393.980???5.2592.87996.859???6.1311.45498.314???7.088.98099.294???8.064.706100.000???98.213E-119.125E-10100.000???Extraction Method: Principal Component Analysis.

主成分的數(shù)目可以根據(jù)相關(guān)系數(shù)矩陣的特征根來判定,如前所說,相關(guān)系數(shù)矩陣的特征根剛好等于主成分的方差,而方差是變量數(shù)據(jù)蘊(yùn)涵信息的重要判據(jù)之一。根據(jù)λ值決定主成分?jǐn)?shù)目的準(zhǔn)則有三:

i?只取λ>1的特征根對應(yīng)的主成分?

從Total?Variance?Explained表中可見,第一、第二和第三個主成分對應(yīng)的λ值都大于1,這意味著這三個主成分得分的方差都大于1。本例正是根據(jù)這條準(zhǔn)則提取主成分的。?

ii?累計(jì)百分比達(dá)到80%~85%以上的λ值對應(yīng)的主成分?

在Total?Variance?Explained表可以看出,前三個主成分對應(yīng)的λ值累計(jì)百分比達(dá)到89.584%,這暗示只要選取三個主成分,信息量就夠了。?

iii?根據(jù)特征根變化的突變點(diǎn)決定主成分的數(shù)量

從特征根分布的折線圖(Scree?Plot)上可以看到,第4個λ值是一個明顯的折點(diǎn),這暗示選取的主成分?jǐn)?shù)目應(yīng)有p≤4(圖8)。那么,究竟是3個還是4個呢?根據(jù)前面兩條準(zhǔn)則,選3個大致合適(但小有問題)。

?

在Component?Matrix(成分矩陣)中,給出了主成分載荷矩陣,每一列載荷值都顯示了各個變量與有關(guān)主成分的相關(guān)系數(shù)。以第一列為例,0.885實(shí)際上是消費(fèi)支出與第一個主成分的相關(guān)系數(shù)。

Component Matrixa?Component?1消費(fèi)支出.987食品煙酒.812衣著.601居住.928生活用品及服務(wù).877交通通信.868教育文化娛樂.874醫(yī)療保健.778其他用品及服務(wù).930Extraction Method: Principal Component Analysis.a. 1 components extracted.

R語言按地區(qū)劃分的主成分可視化

res.pca <- prcomp(data[, -1], ?scale = TRUE)

最受歡迎的見解

1.matlab偏最小二乘回歸(PLSR)和主成分回歸(PCR)

2.R語言高維數(shù)據(jù)的主成分pca、 t-SNE算法降維與可視化分析

3.主成分分析(PCA)基本原理及分析實(shí)例

4.R語言實(shí)現(xiàn)貝葉斯分位數(shù)回歸、lasso和自適應(yīng)lasso貝葉斯分位數(shù)回歸

5.使用LASSO回歸預(yù)測股票收益數(shù)據(jù)分析

6.r語言中對lasso回歸,ridge嶺回歸和elastic-net模型

7.r語言中的偏最小二乘回歸pls-da數(shù)據(jù)分析

8.R語言用主成分PCA、?邏輯回歸、決策樹、隨機(jī)森林分析心臟病數(shù)據(jù)并高維可視化

9.R語言主成分分析(PCA)葡萄酒可視化:主成分得分散點(diǎn)圖和載荷圖


R語言、SPSS基于主成分PCA的中國城鎮(zhèn)居民消費(fèi)結(jié)構(gòu)研究可視化分析的評論 (共 條)

分享到微博請遵守國家法律
台南市| 镶黄旗| 双城市| 黄陵县| 隆林| 双城市| 会同县| 丁青县| 绵竹市| 德钦县| 济源市| 鸡泽县| 惠州市| 海门市| 苗栗县| 苍南县| 安多县| 若羌县| 仙游县| 云和县| 获嘉县| 咸丰县| 都江堰市| 裕民县| 乌拉特中旗| 喀什市| 华蓥市| 新乡县| 孟村| 长宁县| 来凤县| 上蔡县| 青神县| 乐安县| 桂平市| 喜德县| 高雄县| 德庆县| 巴林右旗| 蕉岭县| 延吉市|