R語言ARMA-EGARCH模型、集成預(yù)測(cè)算法對(duì)SPX實(shí)際波動(dòng)率進(jìn)行預(yù)測(cè)
原文鏈接:http://tecdat.cn/?p=12174
介紹
本文比較了幾個(gè)時(shí)間序列模型,以預(yù)測(cè)SP 500指數(shù)的每日實(shí)際波動(dòng)率?;鶞?zhǔn)是SPX日收益系列的ARMA-EGARCH模型。將其與GARCH模型進(jìn)行比較? 。最后,提出了集合預(yù)測(cè)算法。
假設(shè)條件
實(shí)際波動(dòng)率是看不見的,因此我們只能對(duì)其進(jìn)行估算。這也是波動(dòng)率建模的難點(diǎn)。如果真實(shí)值未知,則很難判斷預(yù)測(cè)質(zhì)量。盡管如此,研究人員為實(shí)際波動(dòng)率開發(fā)了估算器。Andersen,Bollerslev Diebold(2008)??和??Barndorff-Nielsen and Shephard(2007)??以及??Shephard and Sheppard(2009)??提出了一類基于高頻的波動(dòng)率(HEAVY)模型,作者認(rèn)為HEAVY模型給出了??很好的??估計(jì)。
假設(shè):HEAVY實(shí)現(xiàn)的波動(dòng)率估算器無偏且有效。
在下文中,將HEAVY估計(jì)量作為??觀察到的已實(shí)現(xiàn)波動(dòng)率??來確定預(yù)測(cè)性能。
數(shù)據(jù)來源
SPX每日數(shù)據(jù)(平倉收益)
SPX盤中高頻數(shù)據(jù)(HEAVY模型估計(jì))
VIX
VIX衍生品(VIX期貨)
在本文中,我主要關(guān)注前兩個(gè)。
數(shù)據(jù)采集
實(shí)際波動(dòng)率估計(jì)和每日收益
我實(shí)現(xiàn)了Shephard和Sheppard的模型,并估計(jì)了SPX的實(shí)現(xiàn)量。
head(SPXdata)
SPX2.rv ? ? ? SPX2.r ? ? SPX2.rs SPX2.nobs SPX2.open
2000-01-03 0.000157240 -0.010103618 0.000099500 ? ? ?1554 ?34191.16
2000-01-04 0.000298147 -0.039292183 0.000254283 ? ? ?1564 ?34195.04
2000-01-05 0.000307226 ?0.001749195 0.000138133 ? ? ?1552 ?34196.70
2000-01-06 0.000136238 ?0.001062120 0.000062000 ? ? ?1561 ?34191.43
2000-01-07 0.000092700 ?0.026022074 0.000024100 ? ? ?1540 ?34186.14
2000-01-10 0.000117787 ?0.010537636 0.000033700 ? ? ?1573 ?34191.50
SPX2.highlow SPX2.highopen SPX2.openprice SPX2.closeprice
2000-01-03 ? 0.02718625 ? 0.005937756 ? ? ? ?1469.25 ? ? ? ? 1454.48
2000-01-04 ? 0.04052226 ? 0.000000000 ? ? ? ?1455.22 ? ? ? ? 1399.15
2000-01-05 ?-0.02550524 ? 0.009848303 ? ? ? ?1399.42 ? ? ? ? 1401.87
2000-01-06 ?-0.01418039 ? 0.006958070 ? ? ? ?1402.11 ? ? ? ? 1403.60
2000-01-07 ?-0.02806616 ? 0.026126203 ? ? ? ?1403.45 ? ? ? ? 1440.45
2000-01-10 ?-0.01575486 ? 0.015754861 ? ? ? ?1441.47 ? ? ? ? 1456.74
DATE ? SPX2.rvol
2000-01-03 2000-01-03 0.012539537
2000-01-04 2000-01-04 0.017266934
2000-01-05 2000-01-05 0.017527864
2000-01-06 2000-01-06 0.011672103
2000-01-07 2000-01-07 0.009628084
2000-01-10 2000-01-10 0.010852972
SPXdata$SPX2.rv
?是估計(jì)的實(shí)際方差。?SPXdata$SPX2.r
?是每日收益(平倉/平倉)。?SPXdata$SPX2.rvol
?是估計(jì)的實(shí)際波動(dòng)率

?SPXdata$SPX2.rvol
??
基準(zhǔn)模型:SPX每日收益率建模
ARMA-EGARCH
考慮到在條件方差中具有異方差性的每日收益,GARCH模型可以作為擬合和預(yù)測(cè)的基準(zhǔn)。
首先,收益序列是平穩(wěn)的。
Augmented Dickey-Fuller Test
data: ?SPXdata$SPX2.r
Dickey-Fuller = -15.869, Lag order = 16, p-value = 0.01
alternative hypothesis: stationary
分布顯示出尖峰和厚尾。可以通過t分布回歸分布密度圖來近似? 。黑線是內(nèi)核平滑的密度,綠線是t分布密度。

acf(SPXdata$SPX2.r) ?##自相關(guān)系數(shù)圖

Box-Ljung test
data: ?SPXdata$SPX2.r
X-squared = 26.096, df = 1, p-value = 3.249e-07
自相關(guān)圖顯示了每周相關(guān)性。Ljung-Box測(cè)試確認(rèn)了序列存在相關(guān)性。
Series: SPXdata$SPX2.r
ARIMA(2,0,0) with zero mean
Coefficients:
ar1 ? ? ?ar2
-0.0839 ?-0.0633
s.e. ? 0.0154 ? 0.0154
sigma^2 estimated as 0.0001412: ?log likelihood=12624.97
AIC=-25243.94 ? AICc=-25243.93 ? BIC=-25224.92
auro.arima
?表示ARIMA(2,0,0)可以對(duì)收益序列中的自相關(guān)進(jìn)行建模,而eGARCH(1,1)在波動(dòng)率建模中很受歡迎。因此,我選擇具有t分布的ARMA(2,0)-eGARCH(1,1)作為基準(zhǔn)模型。
*---------------------------------*
* ? ? ? GARCH Model Spec ? ? ? ? ?*
*---------------------------------*
Conditional Variance Dynamics
------------------------------------
GARCH Model ? ? : eGARCH(1,1)
Variance Targeting ?: FALSE
Conditional Mean Dynamics
------------------------------------
Mean Model ? ? ?: ARFIMA(2,0,0)
Include Mean ? ? ? ?: TRUE
GARCH-in-Mean ? ? ? : FALSE
Conditional Distribution
------------------------------------
Distribution ? ?: ?std
Includes Skew ? : ?FALSE
Includes Shape ?: ?TRUE
Includes Lambda : ?FALSE
我用4189個(gè)觀測(cè)值進(jìn)行了回測(cè)(從2000-01-03到2016-10-06),使用前1000個(gè)觀測(cè)值訓(xùn)練模型,然后每次向前滾動(dòng)預(yù)測(cè)一個(gè),然后每5個(gè)觀測(cè)值重新估計(jì)模型一次 。下圖顯示??了樣本外??預(yù)測(cè)和相應(yīng)的實(shí)際波動(dòng)率。

預(yù)測(cè)顯示與實(shí)現(xiàn)波動(dòng)率高度相關(guān),超過72%。
cor(egarch_model$roll.pred$realized_vol, egarch_model$roll.pred$egarch.predicted_vol,
method = "spearman")
[1] 0.7228007
誤差摘要和繪圖
Min. ? ?1st Qu. ? ? Median ? ? ? Mean ? ?3rd Qu. ? ? ? Max.
-0.0223800 -0.0027880 -0.0013160 -0.0009501 ?0.0003131 ?0.0477600

平均誤差平方(MSE):
[1] 1.351901e-05
?
改進(jìn):實(shí)際GARCH模型和LRD建模
實(shí)際GARCH
realGARCH
?該模型由??Hansen,Huang和Shek(2012)??(HHS2012)提出,該模型?使用非對(duì)稱動(dòng)力學(xué)表示將實(shí)際(已實(shí)現(xiàn))波動(dòng)率測(cè)度與潛在??真實(shí)波動(dòng)率聯(lián)系起來。與標(biāo)準(zhǔn)GARCH模型不同,它是收益和實(shí)際波動(dòng)率度量的聯(lián)合建模(本文中的HEAVY估計(jì)器)。?
模型:
*---------------------------------*
* ? ? ? GARCH Model Spec ? ? ? ? ?*
*---------------------------------*
Conditional Variance Dynamics
------------------------------------
GARCH Model ? ? : realGARCH(2,1)
Variance Targeting ?: FALSE
Conditional Mean Dynamics
------------------------------------
Mean Model ? ? ?: ARFIMA(2,0,0)
Include Mean ? ? ? ?: TRUE
GARCH-in-Mean ? ? ? : FALSE
Conditional Distribution
------------------------------------
Distribution ? ?: ?norm
Includes Skew ? : ?FALSE
Includes Shape ?: ?FALSE
Includes Lambda : ?FALSE
滾動(dòng)預(yù)測(cè)過程與上述ARMA-EGARCH模型相同。下圖顯示??了樣本外??預(yù)測(cè)和相應(yīng)的實(shí)際波動(dòng)率。
?

?
預(yù)測(cè)與實(shí)際的相關(guān)性超過77%
cor(arfima_egarch_model$roll.pred$realized_vol, arfima_egarch_model$roll.pred$arfima_egarch.predicted_vol,
method = "spearman")
[1] 0.7707991
?誤差摘要和圖:
Min. ? ?1st Qu. ? ? Median ? ? ? Mean ? ?3rd Qu. ? ? ? Max.
-1.851e-02 -1.665e-03 -4.912e-04 -1.828e-05 ?9.482e-04 ?5.462e-02

均方誤差(MSE):
[1] 1.18308e-05
?備注:
用于每日收益序列的ARMA-eGARCH模型和用于實(shí)際波動(dòng)率的ARFIMA-eGARCH模型利用不同的信息源。ARMA-eGARCH模型僅涉及每日收益,而ARFIMA-eGARCH模型基于HEAVY估算器,該估算器是根據(jù)日內(nèi)數(shù)據(jù)計(jì)算得出的。RealGARCH模型將它們結(jié)合在一起。
以均方誤差衡量,ARFIMA-eGARCH模型的性能略優(yōu)于realGARCH模型。這可能是由于ARFIMA-eGARCH模型的LRD特性所致。
集成模型
隨機(jī)森林?
現(xiàn)在已經(jīng)建立了三個(gè)預(yù)測(cè)
ARMA?
egarch_model
realGARCH?
rgarch model
ARFIMA-eGARCH?
arfima_egarch_model
盡管這三個(gè)預(yù)測(cè)顯示出很高的相關(guān)性,但預(yù)計(jì)模型平均值會(huì)減少預(yù)測(cè)方差,從而提高準(zhǔn)確性。使用了隨機(jī)森林集成。
varImpPlot(rf$model)

隨機(jī)森林由500棵樹組成,每棵樹隨機(jī)選擇2個(gè)預(yù)測(cè)以適合實(shí)際值。下圖是擬合和實(shí)際波動(dòng)率。

預(yù)測(cè)與實(shí)際波動(dòng)率的相關(guān)性:
[1] 0.840792
誤差圖:

均方誤差:
[1] 1.197388e-05
MSE與實(shí)際波動(dòng)率方差的比率
[1] 0.2983654
備注
涉及已實(shí)際量度信息的realGARCH模型和ARFIMA-eGARCH模型優(yōu)于標(biāo)準(zhǔn)的收益序列ARMA-eGARCH模型。與基準(zhǔn)相比,隨機(jī)森林集成的MSE減少了17%以上。
從信息源的角度來看,realGARCH模型和ARFIMA-eGARCH模型捕獲了日內(nèi)高頻數(shù)據(jù)中的增量信息(通過模型,HEAVY實(shí)際波動(dòng)率估算)
進(jìn)一步研究:隱含波動(dòng)率
以上方法不包含隱含波動(dòng)率數(shù)據(jù)。隱含波動(dòng)率是根據(jù)SPX歐洲期權(quán)計(jì)算得出的。自然的看法是將隱含波動(dòng)率作為預(yù)測(cè)已實(shí)現(xiàn)波動(dòng)率的預(yù)測(cè)因子。但是,大量研究表明,無模型的隱含波動(dòng)率VIX是有偏估計(jì)量,不如基于過去實(shí)際波動(dòng)率的預(yù)測(cè)有效。?Torben G. Andersen,Per Frederiksen和Arne D. Staal(2007)??同意這種觀點(diǎn)。他們的工作表明,將隱含波動(dòng)率引入時(shí)間序列分析框架不會(huì)帶來任何明顯的好處。但是,作者指出了隱含波動(dòng)率中增量信息的可能性,并提出了組合模型。
因此,進(jìn)一步的發(fā)展可能是將時(shí)間序列預(yù)測(cè)和隱含波動(dòng)率(如果存在)的預(yù)測(cè)信息相結(jié)合的集成模型。
?

最受歡迎的見解
1.HAR-RV-J與遞歸神經(jīng)網(wǎng)絡(luò)(RNN)混合模型預(yù)測(cè)和交易大型股票指數(shù)的高頻波動(dòng)率
2.R語言中基于混合數(shù)據(jù)抽樣(MIDAS)回歸的HAR-RV模型預(yù)測(cè)GDP增長
3.波動(dòng)率的實(shí)現(xiàn):ARCH模型與HAR-RV模型
4.R語言ARMA-EGARCH模型、集成預(yù)測(cè)算法對(duì)SPX實(shí)際波動(dòng)率進(jìn)行預(yù)測(cè)
5.GARCH(1,1),MA以及歷史模擬法的VaR比較
6.R語言多元COPULA GARCH 模型時(shí)間序列預(yù)測(cè)
7.R語言基于ARMA-GARCH過程的VAR擬合和預(yù)測(cè)
8.matlab預(yù)測(cè)ARMA-GARCH 條件均值和方差模型
9.R語言對(duì)S&P500股票指數(shù)進(jìn)行ARIMA + GARCH交易策略