最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)據(jù)分享|R語言分析上??諝赓|(zhì)量指數(shù)數(shù)據(jù):kmean聚類、層次聚類、時間序列分析:arim

2023-02-24 23:41 作者:拓端tecdat  | 我要投稿

全文鏈接:http://tecdat.cn/?p=30131

最近我們被客戶要求撰寫關于空氣質(zhì)量指數(shù)的研究報告,包括一些圖形和統(tǒng)計輸出。

最近我們被客戶要求撰寫關于上??諝赓|(zhì)量指數(shù)的研究報告。本文向大家介紹R語言對上海PM2.5等空氣質(zhì)量數(shù)據(jù) 間的相關分析和預測分析,主要內(nèi)容包括其使用實例,具有一定的參考價值,需要的朋友可以參考一下

相關分析(correlation analysis)是研究現(xiàn)象之間是否存在某種依存關系,并對具體有依存關系的現(xiàn)象探討其相關方向以及相關程度,是研究隨機變量之間的相關關系的一種統(tǒng)計方法。分類:

·?????? 線性相關分析:研究兩個變量間線性關系的程度,用相關系數(shù)r來描述。常用的三種計算方式有Pearson相關系數(shù)、Spearman和Kendall相關系數(shù)。

·?????? 偏相關分析:當兩個變量同時與第三個變量相關時,將第三個變量的影響剔除,只分析另外兩個變量之間相關程度的過程。如控制年齡和工作經(jīng)驗的影響,估計工資收入與受教育水平之間的相關關系。

在變量較多的復雜情況下,變量之間的偏相關系數(shù)比簡單相關系數(shù)更加適合于刻畫變量之間的相關性。

PM2.5細顆粒物指環(huán)境空氣中空氣動力學當量直徑小于等于2.5微米的顆粒物。它能較長時間懸浮于空氣中,其在空氣中含量濃度越高,就代表空氣污染越嚴重。與較粗的大氣顆粒物相比,PM2.5粒徑小,面積大,活性強,易附帶有毒、有害物質(zhì)(例如,重金屬、微生物等),且在大氣中的停留時間長、輸送距離遠,因而對人體健康和大氣環(huán)境質(zhì)量的影響更大。

pydat2=read.csv("上海市_05.csv",header=T)pydat3=read.csv("上海市_06.csv",header=T) ? head(pydat) head(pydat2) ? attach(pydat) ? plot(pydat[,c(8:10)], ???? col=質(zhì)量等級)#畫出變量相關圖

???? col=質(zhì)量等級)#畫出變量相關圖

???? col=質(zhì)量等級)#畫出變量相關圖

上面的圖中不同顏色代表不同的空氣質(zhì)量地區(qū),從所有變量的兩兩關系散點圖來看,可以看到pm2.5和pm10的關系圖可以比較好的區(qū)分出不同空氣質(zhì)量的地區(qū)。并且他們之間存在正相關關系。

對數(shù)據(jù)進行聚類

plot(hc1, ???? main="層次聚類") ? ??????????? border = "red")

對數(shù)據(jù)進行層次聚類后,根據(jù)譜系圖可以發(fā)現(xiàn),所有樣本大概可以分成5個類別。因此,后續(xù)對數(shù)據(jù)進行kmean聚類。

點擊標題查閱往期內(nèi)容

R語言空氣污染數(shù)據(jù)的地理空間可視化和分析:顆粒物2.5(PM2.5)和空氣質(zhì)量指數(shù)(AQI)

左右滑動查看更多

01

02

03

04

剔除缺失值

? plot(pydat[,8:12], ???? col =km$cluster, ???? main="聚類結果1")

???? main="聚類結果2")

???? main="聚類結果3")

通過kmeans的可視化結果來看,kmeans方法比較好的將所有樣本點區(qū)分開來,其中綠色的樣本點各項指標值較低,紅色樣本點各項指標值較高,藍色和黑色樣本點主要在O3,NO2 等指標上有較明顯的區(qū)別。為了具體比較每個類的指標,下面對每個類的數(shù)據(jù)特征進行描述。

#每個類中的空氣質(zhì)量情況par(mfrow=c(3,4)) ? boxplot(pydat[,8]~pydat[,23])#聚類結果和pm2.5的關系?

從上面的箱線圖,可以看到每個類別的特征,第一類O3值較高,第二個類PM2.5的值較高,第三個類pm2.5,NO值較低,第4類O3水平較低,PM10值較高,第五類的各個指標值都相對較低。因此第5個類別空氣質(zhì)量比較好。其他各個類別的地區(qū)在不同指標上有不同特征。

par(mfrow=c(2,3))hist(as.numeric(pydat[km$cluster==1,6])) ?

再看每個類中空氣質(zhì)量水平的頻率,可以看到第一個類的地區(qū)空氣質(zhì)量水平大多在良好水平,第二個類地區(qū)水平層次不齊,第3個類空氣質(zhì)量水平在4居多,因此空氣質(zhì)量較差,第4個類別2,3居多,因此良好,第5個類大多地區(qū)集中在1-3,因此空氣質(zhì)量最好。

? ? ? unique(pydat[pydat[,23]==5,4]) ? unique(pydat[pydat[,23]==1,4]) ?[1]??????????????? 十五廠???????? 虹口?????????? 徐匯上師大???? 楊浦四漂?????? 青浦淀山湖??? ?[7] 靜安監(jiān)測站???? 浦東川沙?????? 浦東新區(qū)監(jiān)測站 浦東張江????? 12 Levels:? 虹口 靜安監(jiān)測站 美國領事館 普陀 浦東川沙 浦東新區(qū)監(jiān)測站 浦東張江 ... 楊浦四漂 > unique(pydat[pydat[,23]==2,4]) ?[1] 楊浦四漂?????? 浦東新區(qū)監(jiān)測站 徐匯上師大???? 靜安監(jiān)測站???? 青浦淀山湖???? 虹口????????? ?[7] 十五廠???????? 浦東川沙?????? 浦東張江?????? 普陀??????????????? ????????? 12 Levels:? 虹口 靜安監(jiān)測站 美國領事館 普陀 浦東川沙 浦東新區(qū)監(jiān)測站 浦東張江 ... 楊浦四漂 > unique(pydat[pydat[,23]==3,4]) ?[1]??????????????? 十五廠???????? 虹口?????????? 徐匯上師大???? 楊浦四漂?????? 青浦淀山湖??? ?[7] 靜安監(jiān)測站???? 浦東川沙?????? 浦東新區(qū)監(jiān)測站 浦東張江????? 12 Levels:? 虹口 靜安監(jiān)測站 美國領事館 普陀 浦東川沙 浦東新區(qū)監(jiān)測站 浦東張江 ... 楊浦四漂 > unique(pydat[pydat[,23]==4,4]) ?[1] 虹口?????????? 靜安監(jiān)測站???? 十五廠??????????????????????? 浦東新區(qū)監(jiān)測站 浦東張江????? ?[7] 徐匯上師大???? 青浦淀山湖???? 楊浦四漂?????? 浦東川沙?????? 普陀????????? 12 Levels:? 虹口 靜安監(jiān)測站 美國領事館 普陀 浦東川沙 浦東新區(qū)監(jiān)測站 浦東張江 ... 楊浦四漂 > unique(pydat[pydat[,23]==5,4])[1] 普陀?????? 靜安監(jiān)測站 12 Levels:? 虹口 靜安監(jiān)測站 美國領事館 普陀 浦東川沙 浦東新區(qū)監(jiān)測站 浦東張江 ... 楊浦四漂

時間序列分析

? ###對AQi值進行時間序列分析? plot.ts(mynx1)

指數(shù)平滑法

plot.ts(train)

plot.ts(mynxSMA3)

plot.ts(mynxSMA10)

對時間序列進行平滑后,可以看到數(shù)據(jù)有較穩(wěn)定的波動趨勢。

#畫出原始時間序列和預測的plot(mynxforecasts) mynxforecasts$SSE

得到紅色的擬合數(shù)據(jù)和黑色的原始數(shù)據(jù),可以看到模型擬合較好。

預測

mynxforecasts2 plot.forecast(mynxforecasts2)lines(mynx1)#原始數(shù)據(jù)預測對比

使用該模型對數(shù)據(jù)進行擬合,可以看到測試集的數(shù)據(jù)基本上再預測的置信區(qū)間之內(nèi)。

向后預測90天

mynxforecasts2 plot.forecast(mynxforecasts2)

然后對未來的數(shù)據(jù)進行預測額,可以得到預測的區(qū)間。

由于后續(xù)預測的數(shù)值區(qū)間較大,因此我們使用arima模型進行擬合,測試效果。

arima模型

plot(pre)#繪制預測數(shù)據(jù)prev=train-residuals(fit3)#原始數(shù)據(jù)pre$mean#每天的預測均值lines(prev,col="red")#擬合原始數(shù)據(jù)

同樣得到擬合和預測的值,紅色代表擬合的樣本點,黑色代表原始的樣本點,后面的代表預測的數(shù)據(jù)和置信區(qū)間,可以看到樣本擬合的狀況較好,預測的區(qū)間比指數(shù)平滑法要精確。

數(shù)據(jù)獲取

在公眾號后臺回復“空氣數(shù)據(jù)”,可免費獲取完整數(shù)據(jù)。


點擊文末?“閱讀原文”

獲取全文完整代碼數(shù)據(jù)資料。

本文選自《R語言分析上??諝赓|(zhì)量指數(shù)數(shù)據(jù):kmean聚類、層次聚類、時間序列分析:arima模型、指數(shù)平滑法》。

點擊標題查閱往期內(nèi)容

R語言分布滯后非線性模型(DLNM)空氣污染研究溫度對死亡率影響建模應用
Python中的ARIMA模型、SARIMA模型和SARIMAX模型對時間序列預測
Python用RNN神經(jīng)網(wǎng)絡:LSTM、GRU、回歸和ARIMA對COVID19新冠疫情人數(shù)時間序列預測
數(shù)據(jù)分享|PYTHON用ARIMA ,ARIMAX預測商店商品銷售需求時間序列數(shù)據(jù)
Python用RNN神經(jīng)網(wǎng)絡:LSTM、GRU、回歸和ARIMA對COVID19新冠疫情人數(shù)時間序列預測
【視頻】Python用LSTM長短期記憶神經(jīng)網(wǎng)絡對不穩(wěn)定降雨量時間序列進行預測分析|數(shù)據(jù)分享
深度學習實現(xiàn)自編碼器Autoencoder神經(jīng)網(wǎng)絡異常檢測心電圖ECG時間序列spss modeler用決策樹神經(jīng)網(wǎng)絡預測ST的股票
Python中TensorFlow的長短期記憶神經(jīng)網(wǎng)絡(LSTM)、指數(shù)移動平均法預測股票市場和可視化
RNN循環(huán)神經(jīng)網(wǎng)絡 、LSTM長短期記憶網(wǎng)絡實現(xiàn)時間序列長期利率預測
結合新冠疫情COVID-19股票價格預測:ARIMA,KNN和神經(jīng)網(wǎng)絡時間序列分析
深度學習:Keras使用神經(jīng)網(wǎng)絡進行簡單文本分類分析新聞組數(shù)據(jù)
用PyTorch機器學習神經(jīng)網(wǎng)絡分類預測銀行客戶流失模型
PYTHON用LSTM長短期記憶神經(jīng)網(wǎng)絡的參數(shù)優(yōu)化方法預測時間序列洗發(fā)水銷售數(shù)據(jù)
Python用Keras神經(jīng)網(wǎng)絡序列模型回歸擬合預測、準確度檢查和結果可視化
R語言深度學習卷積神經(jīng)網(wǎng)絡 (CNN)對 CIFAR 圖像進行分類:訓練與結果評估可視化
深度學習:Keras使用神經(jīng)網(wǎng)絡進行簡單文本分類分析新聞組數(shù)據(jù)
Python用LSTM長短期記憶神經(jīng)網(wǎng)絡對不穩(wěn)定降雨量時間序列進行預測分析
R語言深度學習Keras循環(huán)神經(jīng)網(wǎng)絡(RNN)模型預測多輸出變量時間序列
R語言KERAS用RNN、雙向RNNS遞歸神經(jīng)網(wǎng)絡、LSTM分析預測溫度時間序列、 IMDB電影評分情感
Python用Keras神經(jīng)網(wǎng)絡序列模型回歸擬合預測、準確度檢查和結果可視化
Python用LSTM長短期記憶神經(jīng)網(wǎng)絡對不穩(wěn)定降雨量時間序列進行預測分析
R語言中的神經(jīng)網(wǎng)絡預測時間序列:多層感知器(MLP)和極限學習機(ELM)數(shù)據(jù)分析報告
R語言深度學習:用keras神經(jīng)網(wǎng)絡回歸模型預測時間序列數(shù)據(jù)
Matlab用深度學習長短期記憶(LSTM)神經(jīng)網(wǎng)絡對文本數(shù)據(jù)進行分類
R語言KERAS深度學習CNN卷積神經(jīng)網(wǎng)絡分類識別手寫數(shù)字圖像數(shù)據(jù)(MNIST)
MATLAB中用BP神經(jīng)網(wǎng)絡預測人體脂肪百分比數(shù)據(jù)
Python中用PyTorch機器學習神經(jīng)網(wǎng)絡分類預測銀行客戶流失模型
R語言實現(xiàn)CNN(卷積神經(jīng)網(wǎng)絡)模型進行回歸數(shù)據(jù)分析
SAS使用鳶尾花(iris)數(shù)據(jù)集訓練人工神經(jīng)網(wǎng)絡(ANN)模型
【視頻】R語言實現(xiàn)CNN(卷積神經(jīng)網(wǎng)絡)模型進行回歸數(shù)據(jù)分析
Python使用神經(jīng)網(wǎng)絡進行簡單文本分類
R語言用神經(jīng)網(wǎng)絡改進Nelson-Siegel模型擬合收益率曲線分析
R語言基于遞歸神經(jīng)網(wǎng)絡RNN的溫度時間序列預測
R語言神經(jīng)網(wǎng)絡模型預測車輛數(shù)量時間序列
R語言中的BP神經(jīng)網(wǎng)絡模型分析學生成績
matlab使用長短期記憶(LSTM)神經(jīng)網(wǎng)絡對序列數(shù)據(jù)進行分類
R語言實現(xiàn)擬合神經(jīng)網(wǎng)絡預測和結果可視化
用R語言實現(xiàn)神經(jīng)網(wǎng)絡預測股票實例
使用PYTHON中KERAS的LSTM遞歸神經(jīng)網(wǎng)絡進行時間序列預測
python用于NLP的seq2seq模型實例:用Keras實現(xiàn)神經(jīng)網(wǎng)絡機器翻譯
用于NLP的Python:使用Keras的多標簽文本LSTM神經(jīng)網(wǎng)絡分類


數(shù)據(jù)分享|R語言分析上??諝赓|(zhì)量指數(shù)數(shù)據(jù):kmean聚類、層次聚類、時間序列分析:arim的評論 (共 條)

分享到微博請遵守國家法律
广平县| 杭锦旗| 九江市| 贵德县| 新龙县| 台山市| 巴青县| 调兵山市| 锡林浩特市| 华蓥市| 绵竹市| 平湖市| 安陆市| 双桥区| 鹿邑县| 新平| 上栗县| 沾化县| 临高县| 大荔县| 新营市| 大连市| 崇左市| 称多县| 库车县| 宽城| 横峰县| 海南省| 阆中市| 靖边县| 沾益县| 绥滨县| 琼结县| 邯郸市| 扬中市| 雅安市| 莎车县| 新兴县| 安陆市| 岳普湖县| 宽城|