最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

R語言主成分PCA、因子分析、聚類對(duì)地區(qū)經(jīng)濟(jì)研究分析重慶市經(jīng)濟(jì)指標(biāo)|附代碼數(shù)據(jù)

2023-02-04 00:34 作者:拓端tecdat  | 我要投稿

全文下載鏈接:http://tecdat.cn/?p=27515?

最近我們被客戶要求撰寫關(guān)于重慶市經(jīng)濟(jì)指標(biāo)的研究報(bào)告,包括一些圖形和統(tǒng)計(jì)輸出。

建立重慶市經(jīng)濟(jì)指標(biāo)發(fā)展體系,以重慶市一小時(shí)經(jīng)濟(jì)圈作為樣本,運(yùn)用因子分析方法進(jìn)行實(shí)證分析,在借鑒了相關(guān)評(píng)價(jià)理論和評(píng)價(jià)方法的基礎(chǔ)上,本文提取出經(jīng)濟(jì)規(guī)模、人均發(fā)展水平、經(jīng)濟(jì)發(fā)展?jié)摿Α?個(gè)主因子,從重慶市統(tǒng)計(jì)年鑒選取8個(gè)指標(biāo)構(gòu)成的指標(biāo)體系數(shù)據(jù)對(duì)重慶市38個(gè)區(qū)縣經(jīng)濟(jì)發(fā)展基本情況的八項(xiàng)指標(biāo)進(jìn)行分析,并基于主因子得分矩陣對(duì)重慶市38個(gè)區(qū)縣進(jìn)行聚類分析

結(jié)果表明:根據(jù)綜合得分,可以看出各區(qū)縣社會(huì)經(jīng)濟(jì)發(fā)展水平排前三的是渝中區(qū)、渝北區(qū)、九龍坡區(qū),得分最低的三個(gè)是巫山縣、巫溪縣、城口縣,結(jié)合總體的分析可以看出渝中區(qū)、九龍坡區(qū)在經(jīng)濟(jì)總體規(guī)模和建筑業(yè)方面較好,而重慶周邊的地區(qū)經(jīng)濟(jì)實(shí)力較差,投資環(huán)境不好,特別是在建筑方面的缺乏,以至于經(jīng)濟(jì)發(fā)展相對(duì)而言薄弱的地區(qū),不論從哪方面來說重慶各區(qū)縣中渝中區(qū)的經(jīng)濟(jì)實(shí)力是最好的。

評(píng)價(jià)指標(biāo)的建立

評(píng)價(jià)地區(qū)的之間的經(jīng)濟(jì)發(fā)展水平,必須建立適當(dāng)?shù)闹笜?biāo)體系。考慮到地區(qū)經(jīng)濟(jì)指標(biāo)的復(fù)雜性、多樣性和可操作性,本文在此基礎(chǔ)上建立了一套較為完整的易于定量分析的地區(qū)經(jīng)濟(jì)評(píng)價(jià)指標(biāo)體系,分別從不同的角度反映地區(qū)經(jīng)濟(jì)發(fā)展特征。

本文所建立的指標(biāo)體系共包括8個(gè)指標(biāo),分別從經(jīng)濟(jì)規(guī)模、人均發(fā)展水平、經(jīng)濟(jì)發(fā)展?jié)摿Φ确矫鎭矸从车貐^(qū)經(jīng)濟(jì)發(fā)展特征。具體指標(biāo)如下:

地區(qū)生產(chǎn)總值(萬元)(X1) ?????????????

社會(huì)消費(fèi)品零售總額(萬元)(X2)

工業(yè)總產(chǎn)值(萬元)(X3)

建筑業(yè)總產(chǎn)值(萬元)(X4)

高技術(shù)生產(chǎn)總值(萬元)(X5)

全社會(huì)固定資產(chǎn)投資(萬元)(X6)

人均可支配收入(元)(X7)

人均地區(qū)生產(chǎn)總值(元)(X8)

因子分析在地區(qū)經(jīng)濟(jì)研究中的應(yīng)用

因子分析模型及其步驟

因子分析是一種數(shù)據(jù)簡(jiǎn)化的技術(shù)。它通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測(cè)數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)假想變量來表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個(gè)假想變量能夠反映原來眾多變量的主要信息。原始的變量是可觀測(cè)的顯在變量,而假想變量是不可觀測(cè)的潛在變量,稱為因子。設(shè)p個(gè)變量,則因子分析的數(shù)學(xué)模型可表示為:

為公共因子,是不可觀測(cè)的變量,他們的系數(shù)稱為因子載荷。是特殊因子,是不能被前m個(gè)公共因子包含的部分。因子分析步驟如下:

(1)將原始數(shù)據(jù)標(biāo)準(zhǔn)化,仍記為X;(2)建立相關(guān)系數(shù)矩陣R;(3)解特征方程,計(jì)算特征值和特征向量,當(dāng)累計(jì)貢獻(xiàn)率不低于85%時(shí),提取k個(gè)主成分代替原來的m個(gè)指標(biāo),計(jì)算因子載荷矩陣A;(4)對(duì)A進(jìn)行最大正交旋轉(zhuǎn)交換;(5)對(duì)主因子進(jìn)行命名和解釋。如需進(jìn)行排序,則計(jì)算各個(gè)主因子的得分,以貢獻(xiàn)率為權(quán)重,對(duì)加權(quán)計(jì)算綜合因子得分。

樣本選取及數(shù)據(jù)來源

本文選取了重慶市38個(gè)區(qū)縣作為樣本進(jìn)行分析,目的在于探索如何基于R統(tǒng)計(jì)軟件的因子分析和聚類分析方法研究地區(qū)經(jīng)濟(jì)發(fā)展。具體數(shù)據(jù)如下:


數(shù)據(jù)分析過程

將原始數(shù)據(jù)錄入R軟件中,選取地區(qū)生產(chǎn)總值(萬元)(X1)、社會(huì)消費(fèi)品零售總額(萬元)(X2)、工業(yè)總產(chǎn)值(萬元)(X3)、建筑業(yè)總產(chǎn)值(萬元)(X4)、高技術(shù)生產(chǎn)總值(萬元)(X5)、全社會(huì)固定資產(chǎn)投資(萬元)(X6)、人均可支配收入(元)(X7)、人均地區(qū)生產(chǎn)總值(元)(X8)。

在進(jìn)行因子分析之前,我們通過觀察相關(guān)系數(shù)矩陣,并用KMO and Bartlett’s Test檢驗(yàn)一下數(shù)據(jù)是否適合作因子分析。再做描述性分析Analysis-factor-description得到初始公因子方差、因子、特征值以及由每個(gè)因子解釋的百分比和累計(jì)百分比。分析結(jié)果如下:

coebaltt(COR,)#Bartlett球形檢

Bartlett 的球形度檢驗(yàn)的p值(顯著性概率值sig)<0.05,表明通過檢驗(yàn),分布可以近似為正態(tài)分布,由此則可以進(jìn)行因子分析。

sreeot(PCA,type="lines")



點(diǎn)擊標(biāo)題查閱往期內(nèi)容

數(shù)據(jù)分享|R語言用主成分PCA、?邏輯回歸、決策樹、隨機(jī)森林分析心臟病數(shù)據(jù)并高維可視化

左右滑動(dòng)查看更多

01

02

03

04

從表可以得出,提取3個(gè)因子的累計(jì)方差貢獻(xiàn)率已經(jīng)達(dá)到89.854%>86%,信息損失僅為10.146%,從第4個(gè)因子開始方差貢獻(xiàn)率都低于5%,因此選取3個(gè)公因子進(jìn)行因子分析效果較為理想;從圖的碎石圖可以看出從第4個(gè)因子開始,特征值差異變化很小,綜上所述:在特征值大于0.5的條件下,所提取的三個(gè)因子能通過檢驗(yàn)并能很好的描述8個(gè)指標(biāo),所以提取前3個(gè)特征值建立因子載荷矩陣。?

表中為初始因子載荷矩陣表, F1、F2、F3分別作為第一、第二、第三公共因子。建立了因子分析數(shù)學(xué)目的不僅僅要找出公共因子以及對(duì)變量進(jìn)行分組,更重要的要知道每個(gè)公共因子的意義,以便進(jìn)行進(jìn)一步的分析,如果每個(gè)公共因子的含義不清,則不便于進(jìn)行實(shí)際背景的解釋。由于因子載荷陣是不唯一的,所以應(yīng)該對(duì)因子載荷陣進(jìn)行旋轉(zhuǎn)。目的是使因子載荷陣的結(jié)構(gòu)簡(jiǎn)化,使載荷矩陣每列或行的元素平方值向0和1兩極分化。有三種主要的正交旋轉(zhuǎn)法。四次方最大法、方差最大法和等量最大法。

因此需求進(jìn)行因子旋轉(zhuǎn),使得因子對(duì)變量的貢獻(xiàn)達(dá)到極化的效果。為此采用方差最大化的正交旋轉(zhuǎn)方式,使各變量在某個(gè)因子上產(chǎn)生較高載荷,而其余因子上載荷較小,從而得到旋轉(zhuǎn)后的因子載荷矩陣,如下表所示:

由表和旋轉(zhuǎn)后的因子圖可以看出,通過旋轉(zhuǎn)后的公共因子的解釋原始數(shù)據(jù)的能力提高了,表現(xiàn)為公共因子F1在X1(地區(qū)生產(chǎn)總值),X6(全社會(huì)固定資產(chǎn)投資)和X8(人均地區(qū)生產(chǎn)總值)上的載荷值都很大。因此我們可以把第一公共因子確立為綜合經(jīng)濟(jì)實(shí)力因子,宏觀上反映了地區(qū)經(jīng)濟(jì)發(fā)展規(guī)模的總體情況,在這個(gè)因子上的得分越高,說明城市經(jīng)濟(jì)發(fā)展的總體情況越好。

利用各公共因子方差貢獻(xiàn)率計(jì)算綜合得分,并計(jì)算綜合得分=因子1的方差貢獻(xiàn)率因子1的得分+因子2的方差貢獻(xiàn)率因子2的得分+因子3的方差貢獻(xiàn)率*因子3的得分。將數(shù)據(jù)按綜合得分降序排列,得到部分因子得分和綜合得分情況如下圖所示:



結(jié)果討論

基于上述因子得分,可以得出2012年重慶38個(gè)區(qū)縣的經(jīng)濟(jì)發(fā)展?fàn)顩r如下:

1、根據(jù)經(jīng)濟(jì)實(shí)力因子F1得分大于1的依次有渝中區(qū)、渝北區(qū)、九龍坡區(qū)、江北區(qū)和萬州區(qū),分?jǐn)?shù)分別為4.4211、1.8967、1.7808、1.201、1.2804。說明在經(jīng)濟(jì)總體規(guī)模和建筑業(yè)方面,渝中區(qū)、渝北區(qū)、九龍坡、江北區(qū)和萬州區(qū)在重慶市的38個(gè)區(qū)縣中是最好的,規(guī)模較大,經(jīng)濟(jì)實(shí)力最強(qiáng),發(fā)展前景很好,經(jīng)濟(jì)發(fā)展實(shí)力雄厚的地區(qū)。

2、根據(jù)經(jīng)濟(jì)發(fā)展?jié)摿σ蜃覨2得分大于1的有沙坪壩區(qū)和渝北區(qū),分?jǐn)?shù)分別為3.7052、3.4396。說明在高技術(shù)科技和工業(yè)方面比較發(fā)達(dá),固定資產(chǎn)投資最大,這兩個(gè)地區(qū)都在主城,對(duì)外開放程度高,科技創(chuàng)新方面比較好,有自己的工業(yè)發(fā)展,已基本形成了自己的產(chǎn)業(yè)結(jié)構(gòu),充分發(fā)揮了自己的地理優(yōu)勢(shì)和資源環(huán)境優(yōu)勢(shì),發(fā)展?jié)摿^大。

基于主因子得分的聚類分析

系統(tǒng)聚類分析

聚類分析又稱群分析,就是將數(shù)據(jù)分組成為多個(gè)類。在同一個(gè)類內(nèi)對(duì)象之間具有較高的相似度,不同類之間的對(duì)象差別較大。在社會(huì)經(jīng)濟(jì)領(lǐng)域中存在著大量分類問題,比如若對(duì)某些大城市的物價(jià)指數(shù)進(jìn)行考察,而物價(jià)指數(shù)很多,有農(nóng)用生產(chǎn)物價(jià)指數(shù)、服務(wù)項(xiàng)目?jī)r(jià)指數(shù)、食品消費(fèi)物價(jià)指數(shù)、建材零售價(jià)格指數(shù)等等。由于要考察的物價(jià)指數(shù)很多,通常先對(duì)這些物價(jià)指數(shù)進(jìn)行分類。總之,需要分類的問題很多,因此聚類分析這個(gè)有用的工具越來越受到人們的重視,它在許多領(lǐng)域中都得到了廣泛的應(yīng)用。?
聚類分析內(nèi)容非常豐富,有系統(tǒng)聚類法、有序樣品聚類法、動(dòng)態(tài)聚類法、模糊聚類法、圖論聚類法、聚類預(yù)報(bào)法等;最常用最成功的聚類分析為系統(tǒng)聚類法,系統(tǒng)聚類法的基本思想為先將n個(gè)樣品各自看成一類,然后規(guī)定樣品之間的“距離”和類與類之間的距離。選擇距離最近的兩類合并成一個(gè)新類,計(jì)算新類和其他類(各當(dāng)前類)的距離,再將距離最近的兩類合并。這樣,每次合并減少一類,直至所有的樣品都?xì)w成一類為止。?
系統(tǒng)聚類法的基本步驟:?
1、計(jì)算n個(gè)樣品兩兩間的距離。?
2、構(gòu)造n個(gè)類,每個(gè)類只包含一個(gè)樣品。?
3、合并距離最近的兩類為一新類。?
4、計(jì)算新類與各當(dāng)前類的距離。?
5、重復(fù)步驟3、4,合并距離最近的兩類為新類,直到所有的類并為一類為止。?
6、畫聚類譜系圖。?
7、決定類的個(gè)數(shù)和類。?
系統(tǒng)聚類方法:1、最短距離法;2、最長(zhǎng)距離法;3、中間距離法;4、重心法;5、類平均法;6、離差平方和法(Ward法)。?

基于主因子得分對(duì)重慶市38個(gè)區(qū)縣經(jīng)濟(jì)發(fā)展分析,采用聚類方法選擇組間鏈接法,計(jì)算距離選擇平方歐式距離,標(biāo)準(zhǔn)化數(shù)據(jù)才用標(biāo)準(zhǔn)正太數(shù)據(jù)化處理。得到如下結(jié)果:

rct.st(hc,k?=?6,?border?=?"red")

由樹狀圖可知,可以將重慶各區(qū)縣按經(jīng)濟(jì)中和實(shí)力實(shí)際情況分為六類:

第一類只包括渝中區(qū),渝中區(qū)是重慶市的中心城市,是重慶市的政治經(jīng)濟(jì)文化中心、基礎(chǔ)教育高地、具有特殊的區(qū)位優(yōu)勢(shì)和突出的戰(zhàn)略地位。產(chǎn)業(yè)結(jié)構(gòu)的現(xiàn)狀特征是第三產(chǎn)業(yè)占絕對(duì)優(yōu)勢(shì),其中金融業(yè)、商貿(mào)業(yè)以及中介服務(wù)業(yè)為主導(dǎo)行業(yè),屬于經(jīng)濟(jì)發(fā)展實(shí)力雄厚的地區(qū)。

第二類只包括渝北區(qū),渝北區(qū)先后啟動(dòng)了總體規(guī)劃近65平方公里的重慶科技產(chǎn)業(yè)園、重慶現(xiàn)代農(nóng)業(yè)園區(qū)、渝東開發(fā)區(qū)等項(xiàng)目,被市政府命名為"重慶農(nóng)業(yè)科技園區(qū)",所以該地區(qū)在高技術(shù)生產(chǎn)總值貢獻(xiàn)很大,而且投資環(huán)境優(yōu)越,且大部分地區(qū)有個(gè)自己中心商業(yè)地帶,對(duì)外開放程度高,區(qū)位優(yōu)勢(shì)很明顯,產(chǎn)業(yè)結(jié)構(gòu)合理,屬于經(jīng)濟(jì)發(fā)展較強(qiáng)的地區(qū)。

點(diǎn)擊文末?“閱讀原文”

獲取全文完整資料。

本文選自《R語言主成分PCA、因子分析、聚類對(duì)地區(qū)經(jīng)濟(jì)研究分析重慶市經(jīng)濟(jì)指標(biāo)》。

點(diǎn)擊標(biāo)題查閱往期內(nèi)容

數(shù)據(jù)分享|R語言用主成分PCA、?邏輯回歸、決策樹、隨機(jī)森林分析心臟病數(shù)據(jù)并高維可視化
R語言邏輯回歸logistic模型分析泰坦尼克titanic數(shù)據(jù)集預(yù)測(cè)生還情況R語言是否對(duì)二分連續(xù)變量執(zhí)行邏輯回歸
R語言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級(jí)調(diào)查數(shù)據(jù)
R語言隨機(jī)森林RandomForest、邏輯回歸Logisitc預(yù)測(cè)心臟病數(shù)據(jù)和可視化分析
R語言基于Bagging分類的邏輯回歸(Logistic Regression)、決策樹、森林分析心臟病患者
R語言邏輯回歸(Logistic回歸)模型分類預(yù)測(cè)病人冠心病風(fēng)險(xiǎn)
R語言用局部加權(quán)回歸(Lowess)對(duì)logistic邏輯回歸診斷和殘差分析R語言用主成分PCA、?邏輯回歸、決策樹、隨機(jī)森林分析心臟病數(shù)據(jù)并高維可視化
R語言用線性模型進(jìn)行臭氧預(yù)測(cè):加權(quán)泊松回歸,普通最小二乘,加權(quán)負(fù)二項(xiàng)式模型,多重插補(bǔ)缺失值R語言Bootstrap的嶺回歸和自適應(yīng)LASSO回歸可視化
R語言中回歸和分類模型選擇的性能指標(biāo)
R語言多元時(shí)間序列滾動(dòng)預(yù)測(cè):ARIMA、回歸、ARIMAX模型分析
R語言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級(jí)調(diào)查數(shù)據(jù)
R語言計(jì)量經(jīng)濟(jì)學(xué):虛擬變量(啞變量)在線性回歸模型中的應(yīng)用
R語言 線性混合效應(yīng)模型實(shí)戰(zhàn)案例
R語言混合效應(yīng)邏輯回歸(mixed effects logistic)模型分析肺癌數(shù)據(jù)
R語言如何用潛類別混合效應(yīng)模型(LCMM)分析抑郁癥狀
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言建立和可視化混合效應(yīng)模型mixed effect model
R語言LME4混合效應(yīng)模型研究教師的受歡迎程度
R語言 線性混合效應(yīng)模型實(shí)戰(zhàn)案例
R語言用Rshiny探索lme4廣義線性混合模型(GLMM)和線性混合模型(LMM)
R語言基于copula的貝葉斯分層混合模型的診斷準(zhǔn)確性研究
R語言如何解決線性混合模型中畸形擬合(Singular fit)的問題
基于R語言的lmer混合線性回歸模型
R語言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測(cè)驗(yàn)建立層次(分層)貝葉斯模型
R語言分層線性模型案例
R語言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測(cè)驗(yàn)(SAT)建立分層模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分層線性模型HLM
R語言用WinBUGS 軟件對(duì)學(xué)術(shù)能力測(cè)驗(yàn)建立層次(分層)貝葉斯模型
SPSS中的多層(等級(jí))線性模型Multilevel linear models研究整容手術(shù)數(shù)據(jù)
用SPSS估計(jì)HLM多層(層次)線性模型模型R語言高維數(shù)據(jù)的主成分pca、 t-SNE算法降維與可視化分析案例報(bào)告
R語言懲罰logistic邏輯回歸(LASSO,嶺回歸)高維變量選擇的分類模型案例
R語言有RStan的多維驗(yàn)證性因子分析(CFA)
主成分分析(PCA)原理及R語言實(shí)現(xiàn)及分析實(shí)例
R語言無監(jiān)督學(xué)習(xí):PCA主成分分析可視化
R語言使用Metropolis- Hasting抽樣算法進(jìn)行邏輯回歸
R語言多元Logistic邏輯回歸 應(yīng)用案例
R語言自適應(yīng)LASSO 多項(xiàng)式回歸、二元邏輯回歸和嶺回歸應(yīng)用分析
R語言用邏輯回歸、決策樹和隨機(jī)森林對(duì)信貸數(shù)據(jù)集進(jìn)行分類預(yù)測(cè)
R語言基于樹的方法:決策樹,隨機(jī)森林,Bagging,增強(qiáng)樹
spss modeler用決策樹神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)ST的股票
R語言中自編基尼系數(shù)的CART回歸決策樹的實(shí)現(xiàn)
python在Scikit-learn中用決策樹和隨機(jī)森林預(yù)測(cè)NBA獲勝者
matlab使用分位數(shù)隨機(jī)森林(QRF)回歸樹檢測(cè)異常值
基于隨機(jī)森林、svm、CNN機(jī)器學(xué)習(xí)的風(fēng)控欺詐識(shí)別模型
R語言懲罰logistic邏輯回歸(LASSO,嶺回歸)高維變量選擇的分類模型案例
R語言用標(biāo)準(zhǔn)最小二乘OLS,廣義相加模型GAM?,樣條函數(shù)進(jìn)行邏輯回歸LOGISTIC分


R語言主成分PCA、因子分析、聚類對(duì)地區(qū)經(jīng)濟(jì)研究分析重慶市經(jīng)濟(jì)指標(biāo)|附代碼數(shù)據(jù)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
河南省| 永寿县| 贵州省| 大悟县| 琼海市| 汽车| 高青县| 巴马| 凤山县| 图木舒克市| 佛冈县| 临沂市| 屏山县| 岢岚县| 聂拉木县| 普兰县| 景东| 肇庆市| 北川| 汕头市| 华宁县| 墨竹工卡县| 吕梁市| 霍林郭勒市| 宁海县| 收藏| 云梦县| 徐州市| 海南省| 石柱| 平凉市| 诸暨市| 宁蒗| 东辽县| 新巴尔虎左旗| 镇康县| 淳化县| 天门市| 鄄城县| 威信县| 高平市|