數據分享|R語言ARIMA模型分析預測上??諝赓|量指數AQI時間序列|附代碼數據
全文鏈接:http://tecdat.cn/?p=32265
原文出處:拓端數據部落公眾號
最近我們被客戶要求撰寫關于上??諝赓|量指數的研究報告,包括一些圖形和統(tǒng)計輸出。
指數平滑法對于預測來說是非常有幫助的,而且它對時間序列上面連續(xù)的值之間相關性沒有要求。但是,如果你想使用指數平滑法計算出預測區(qū)間,那么預測誤差必須是不相關的, 而且必須是服從零均值、 方差不變的正態(tài)分布。即使指數平滑法對時間序列連續(xù)數值之間相關性沒有要求,在某種情況下,我們可以通過考慮數據之間的相關性來創(chuàng)建更好的預測模型。
自回歸移動平均模型( ARIMA) 包含一個確定(explicit)的統(tǒng)計模型用于處理時間序列的不規(guī)則部分,它也允許不規(guī)則部分可以自相關。
我們以上??諝赓|量指數AQI做成的時間序列數據為例。 隨著時間增加, 數值變化很大。
下面是excel數據:

data=read.xlsx("上??諝赓|量指數 (1).xlsx") ?head(data)##???? 城市? 日期 AQI指數 ?## 1 上海市 41640???? 193 ?## 2 上海市 41641???? 140 ?## 3 上海市 41642???? 195 ?## 4 上海市 41643???? 137 ?## 5 上海市 41644????? 83 ?## 6 上海市 41645????? 59
把數據轉換成時間序列格式
data=ts(data[,3],start = c(2014,1,1) ,frequency = 365)
查看數據概覽
summary(data)##??? Min. 1st Qu.? Median??? Mean 3rd Qu.??? Max. ?##??? 28.0??? 59.0??? 77.0??? 86.5?? 103.0?? 266.0

平穩(wěn)性檢驗(ADF單位根檢驗)
adf.test(data,k = 5)##? Augmented Dickey-Fuller Test ?## ?## data:? data ?## Dickey-Fuller = -9.987, Lag order = 5, p-value = 0.01 ?## alternative hypothesis: stationary
驗出P值小于0.05,不存在單位根,說明原時間序列穩(wěn)定
找到合適的ARIMA模型
如果你的時間序列是平穩(wěn)的,或者你通過做 n 次差分轉化為一個平穩(wěn)時間序列, 接下來就是要選擇合適的 ARIMA模型,這意味著需要尋找 ARIMA(p,d,q)中合適的 p 值和 q 值。為了得到這些,通常需要檢查[平穩(wěn)時間序列的(自)相關圖和偏相關圖。
觀察 ARIMA 模型的預測誤差是否是平均值為 0 且方差為常數的正態(tài)分布(服從零均值、方差不變的正態(tài)分布) 是個好主意,同時也要觀察連續(xù)預測誤差是否(自)相關。


#AR(1)
js
model=arima(data,c(1,0,0))
AIC
model$aic## [1] 8421.217
找到最小的AIC值
which.min(c(model$aic,model2$aic,model3$aic,model4$aic,model5$aic,model6$aic))## [1] 5
所以最小的AIC是模型5,因此將模型5作為最優(yōu)的模型來建模。
## Coefficients:## Warning in sqrt(diag(x$var.coef)): 產生了NaNs##????????? ar1????? ar2???? ar3????? ma1???? ma2? intercept ?##?????? 1.4415? -1.3018? 0.3937? -0.9435? 0.7885??? 86.8142
評估誤差
#MAE ?mean(abs(model5$residuals))## [1] 24.5714#RMSE ?mean(sqrt(abs(model5$residuals)))## [1] 4.496127
預測未來的變化趨勢
?pred=ts(pre$pred,start = c(2016,5,1),frequency =365)

####繪制預測數據 ?points(pre$pred,

?最受歡迎的見解
1.在python中使用lstm和pytorch進行時間序列預測
2.python中利用長短期記憶模型lstm進行時間序列預測分析
3.Python用RNN循環(huán)神經網絡:LSTM長期記憶、GRU門循環(huán)單元、回歸和ARIMA對COVID-19新冠疫情新增人數時間序列
4.Python TensorFlow循環(huán)神經網絡RNN-LSTM神經網絡預測股票市場價格時間序列和MSE評估準確性
5.r語言copulas和金融時間序列案例
6.R 語言用RNN循環(huán)神經網絡 、LSTM長短期記憶網絡實現時間序列長期利率預測
7.Matlab創(chuàng)建向量自回歸(VAR)模型分析消費者價格指數 (CPI) 和失業(yè)率時間序列
8.r語言k-shape時間序列聚類方法對股票價格時間序列聚類
9.R語言結合新冠疫情COVID-19股票價格預測:ARIMA,KNN和神經網絡時間序列分析