拓端tecdat:R語言極值理論 EVT、POT超閾值、GARCH 模型分析股票指數(shù)VaR、條件CVaR:
原文鏈接:http://tecdat.cn/?p=24182
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
概要
本文用 R 編程語言極值理論 (EVT) 以確定 10 只股票指數(shù)的風(fēng)險(xiǎn)價(jià)值(和條件 VaR)。使用 Anderson-Darling 檢驗(yàn)對(duì) 10 只股票的組合數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn),并使用 Block Maxima 和 Peak-Over-Threshold 的 EVT 方法估計(jì) VaR/CvaR。最后,使用條件異向性 (GARCH) 處理的廣義自回歸來預(yù)測(cè)未來 20 天后指數(shù)的未來值。本文將確定計(jì)算風(fēng)險(xiǎn)因素的不同方法對(duì)模型結(jié)果的影響。
極值理論(最初由Fisher、Tippett和Gnedenko提出)表明,獨(dú)立同分布(iid)變量樣本的分塊最大值的分布會(huì)收斂到三個(gè)極值分布之一。
最近,統(tǒng)計(jì)學(xué)家對(duì)極端值建模的興趣又有了新的變化。極限值分析已被證明在各種風(fēng)險(xiǎn)因素的案例中很有用。在1999年至2008年的金融市場(chǎng)動(dòng)蕩之后,極值分析獲得了有效性,與之前的風(fēng)險(xiǎn)價(jià)值分析不同。極限值代表一個(gè)系統(tǒng)的極端波動(dòng)。極限值分析提供了對(duì)極端事件的概率、規(guī)模和保護(hù)成本的關(guān)系進(jìn)行建模的能力。
?
參考
https://arxiv.org/pdf/1310.3222.pdf
https://www.ma.utexas.edu/mp_arc/c/11/11-33.pdf
http://evt2013.weebly.com/uploads/1/2/6/9/12699923/penalva.pdf
Risk Measurement in Commodities Markets Using Conditional Extreme Value Theory
?
第 1a 部分 - 工作目錄、所需的包和會(huì)話信息
為了開始分析,工作目錄被設(shè)置為包含股票行情的文件夾。然后,安裝所需的 R 編程語言包并包含在包庫中。R 包包括極值理論函數(shù)、VaR 函數(shù)、時(shí)間序列分析、定量交易分析、回歸分析、繪圖和 html 格式的包。
library(ggplot2)
library(tseries)
library(vars)
library(evd)
library(POT)
library(rugarch)
?
第 1b 節(jié) - 格式化專有數(shù)據(jù)
用于此分析的第一個(gè)文件是“Data_CSV.csv”。該文件包含在 DAX 證券交易所上市的 15 家公司的股票代碼數(shù)據(jù),以及 DAX 交易所的市場(chǎng)投資組合數(shù)據(jù)。從這個(gè)數(shù)據(jù)文件中選出了 10 家公司,這些公司最近十年的股價(jià)信息是從谷歌財(cái)經(jīng)下載的。

第 1c 節(jié) - 下載股票代碼數(shù)據(jù)
股票價(jià)格數(shù)據(jù)下載并讀入 R 編程環(huán)境。收益率是用“開盤價(jià)/收盤價(jià) ”計(jì)算的,十家公司的數(shù)據(jù)合并在一個(gè)數(shù)據(jù)框中,(每家公司一列)。
結(jié)果數(shù)據(jù)幀的每一行代表記錄股價(jià)的 10 年中的一個(gè)工作日。然后計(jì)算數(shù)據(jù)幀中每一行的均值。一列 10 年的日期被附加到數(shù)據(jù)框。還創(chuàng)建了僅包含行均值和日期信息的第二個(gè)數(shù)據(jù)框。
alDat <- cbind(retursDaa, returnDta_A,
retrnsata_Ss, reunsataDB,
retunsDta_H, reurnsDta_S, rtunsDaaA,
retrnsaa_senus,reursDtaAlnz,
reurnsData_ailer)
?
第 2a 節(jié) - 探索性數(shù)據(jù)分析
創(chuàng)建一個(gè)數(shù)據(jù)框統(tǒng)計(jì)表,其中包含每列(或公司)的最小值、中值、平均值、最大值、標(biāo)準(zhǔn)偏差、1% 分位數(shù)、5% 分位數(shù)、95% 分位數(shù)、99% 分位數(shù)。分位數(shù)百分比適用于極值。還創(chuàng)建了所有收益率均值的時(shí)間序列圖表。
taeSs<- c(min(x), medan(x), man(x),
max(x), sd(x), quntile(x, .01),
quanile(x, .05), qunile(x, .95),
quatile(x, .99), lngth(x))

第 2b 節(jié) - 10 只股票指數(shù)的 VaR 估計(jì)
all_va.2 <- VAR(lDvarts, p = 2, tpe= "cnst")
# 預(yù)測(cè)未來125天、250天和500天
aDFva100 <- pdc(alDva.c, n.aea = 100, ci = 0.9)

為了開始估算數(shù)據(jù)所隱含的未來事件,我們進(jìn)行了初步的風(fēng)險(xiǎn)值估算。首先,所有行的平均值和日期信息的數(shù)據(jù)框架被轉(zhuǎn)換為時(shí)間序列格式,然后從這個(gè)時(shí)間序列中計(jì)算出風(fēng)險(xiǎn)值。根據(jù)VaR計(jì)算對(duì)未來100天和500天的價(jià)值進(jìn)行預(yù)測(cè)。在隨后的預(yù)測(cè)圖中,藍(lán)色圓圈代表未來100天的數(shù)值,紅色圓圈代表500天的回報(bào)值。
plot(ap0$t$Tme[1:1200],
alF_ar.d.$fst[1:1200])



第 2c 部分 - 估計(jì)期望shortfall(ES),條件VAR(CvaR)?10 股票指數(shù)
為便于比較,計(jì)算了10只股票指數(shù)數(shù)據(jù)的條件風(fēng)險(xiǎn)值(CvaR或估計(jì)虧損)。首先,利用數(shù)據(jù)的時(shí)間序列,找到最差的0.95%的跌幅的最大值。然后,通過 "高斯 "方法計(jì)算出估計(jì)虧損,這兩種計(jì)算的結(jié)果都以表格形式呈現(xiàn)。
ES(s(lD1:2528, 2, rp=FAE]),p=0.95, mho="gausn")

第 2d 節(jié) - 10 只股票指數(shù)的希爾Hill估計(jì)
由于假設(shè)10股指數(shù)數(shù)據(jù)為重尾分布,數(shù)據(jù)極少變化,所以采用Hill Estimation對(duì)尾指數(shù)進(jìn)行參數(shù)估計(jì)。目的是驗(yàn)證 10 只股票數(shù)據(jù)是否為極值分布。Hill Estimation 生成的圖證實(shí)了。
hil(orvtis, otio="x", trt=15, nd=45)

第 2e 節(jié) - 正態(tài)分布的 Anderson-Darling 檢驗(yàn)
Anderson-Darling 檢驗(yàn)主要用于分布族,是分布非正態(tài)性的決定因素。在樣本量較大的情況下(如在 10 股指數(shù)中),小于 0.05 的 P 值表明分布與正態(tài)性不同。這是極值分布的預(yù)期。使用 Anderson-Darling 檢驗(yàn)發(fā)現(xiàn)的概率值為 3.7^-24,因此證實(shí)了非正態(tài)性。

第 2f 節(jié) - 結(jié)果表
最后,給出了10個(gè)股票指數(shù)未來價(jià)值的估計(jì)結(jié)果表。3 個(gè) VaR 估計(jì)值(和估計(jì)差額)的點(diǎn)估計(jì)值和范圍被制成表格以比較。
VaRES[3,] <- c("ES", etFbl[1], 4)
eSFbe[2], estFtbl[3],
rond(eSab[4], 4))

第 3a 節(jié) - 10 個(gè)股票指數(shù)的 EVT 分塊最大值估計(jì)
極值理論中的 Block Maxima 方法是 EVT 分析的最基本方法。Block Maxima 包括將觀察期劃分為相同大小的不重疊的時(shí)期,并將注意力限制在每個(gè)時(shí)期的最大觀察值上。創(chuàng)建的觀察遵循吸引條件的域,近似于極值分布。然后將極值分布的參數(shù)統(tǒng)計(jì)方法應(yīng)用于這些觀察。
極值理論家開發(fā)了廣義極值分布。GEV 包含一系列連續(xù)概率分布,即 Gumbel、Frechet 和 Weibull 分布(也稱為 I、II 和 III 型極值分布)。
在以下 EVT Block Maxima 分析中,10 股指數(shù)數(shù)據(jù)擬合 GEV。繪制得到的分布。創(chuàng)建時(shí)間序列圖以定位時(shí)間軸上的極端事件,從 2006 年到 2016 年。然后創(chuàng)建四個(gè)按 Block Maxima 數(shù)據(jù)順序排列的圖。最后,根據(jù) gev() 函數(shù)創(chuàng)建 Block Maxima 分析參數(shù)表。
gev(ltMeans, x=0.8, m=0)
plt(alVF)




第 3b 節(jié) - 分塊最大值的 VaR 預(yù)測(cè)
為了從 Block Maxima 數(shù)據(jù)中創(chuàng)建風(fēng)險(xiǎn)價(jià)值 (VaR) 估計(jì),將 10 股指數(shù) GEV 數(shù)據(jù)轉(zhuǎn)換為時(shí)間序列。VaR 估計(jì)是根據(jù) GEV 時(shí)間序列數(shù)據(jù)進(jìn)行的。未來值的預(yù)測(cè)(未來 100 天和 500 天)是從 VaR 數(shù)據(jù)推斷出來的。在結(jié)果圖中,藍(lán)色圓圈表示未來 100 天的值,紅色圓圈表示 500 天的收益率值。
# 預(yù)測(cè)未來500天
aGE500<- preit(aG_va.c, n.ad = 500, ci = 0.9)
plot(aGE500pd.500)



第 3c 部分 - 分塊最大值的期望損失ES (CvaR)
10只股票指數(shù)GEV數(shù)據(jù)的條件風(fēng)險(xiǎn)值("CvaR "或 "期望損失")被計(jì)算。首先,利用數(shù)據(jù)的時(shí)間序列,找到最差的0.95%的縮水的最大值。然后,通過極端分布的 "修正 "方法來計(jì)算 "估計(jì)虧損",這兩種計(jì)算的結(jié)果都以表格形式呈現(xiàn)。
# 條件縮減是最差的0.95%縮減的平均值
ddGV <- xdrow(aEVts[,2])
# CvaR(預(yù)期虧損)估計(jì)值
CvaR(ts(alE), p=0.95, meho="miie")

?
第 3d 節(jié) - 分塊極大值的 Hill 估計(jì)
希爾估計(jì)(用于尾部指數(shù)的參數(shù)估計(jì))驗(yàn)證 10 只股票的 GEV 數(shù)據(jù)是極值分布。

第 3e 節(jié) - 正態(tài)分布的 Anderson-Darling 檢驗(yàn)
Anderson-Darling 檢驗(yàn)是確定大樣本數(shù)量分布的非正態(tài)性的有力決定因素。如果 P 值小于 0.05,則分布與正態(tài)性不同。通過該測(cè)試發(fā)現(xiàn)了一個(gè)微小的概率值 3.7^-24。

第 3f 節(jié) - 結(jié)果表
最后,給出了對(duì) 10 股指數(shù) GEV 未來價(jià)值的估計(jì)結(jié)果表。3 個(gè) GEV VaR 估計(jì)值(和 GEV 期望損失)的點(diǎn)估計(jì)值和范圍制成表格比較。
G_t[3,] <- c("GEV ES",sFale[1],
sStble[2], SEble[3],
"NA")
GRst
第 3g 節(jié) - 分塊極大值的 100 天 GARCH 預(yù)測(cè)
通過將 Block Maxima GEV 分布(10 只股票的指數(shù))擬合到 GARCH(1,1)(廣義自回歸條件異型)模型,對(duì) Block Maxima EVT 數(shù)據(jù)進(jìn)行預(yù)測(cè)。顯示預(yù)測(cè)公式參數(shù)表。創(chuàng)建一個(gè)“自相關(guān)函數(shù)”(ACF) 圖,顯示隨時(shí)間變化的重要事件。然后,顯示擬合模型結(jié)果的一組圖。創(chuàng)建對(duì)未來 20 天(股票指數(shù)表現(xiàn))的預(yù)測(cè)。最后,20 天的預(yù)測(cè)顯示在 2 個(gè)圖中。
spec(aanc.ol = list(mel = 'eGARCH',
garer= c(1, 1)),
dirion = 'sd')
# 用廣義自回歸條件異質(zhì)性擬合模型
alimol = ugct(pec,allV, sovr = 'ybi')
cofale <- dtafe(cof(litol))
oeBal
plt(l.itodl)
?
第 4a 節(jié) - 峰值超過閾值估計(jì) - 10 個(gè)股票指數(shù)
在 EVT 中的峰值超過閾值方法中,選擇超過某個(gè)高閾值的初始觀測(cè)值。這些選定觀測(cè)值的概率分布近似為廣義帕累托分布。通過擬合廣義帕累托分布來創(chuàng)建最大似然估計(jì) (mle)。MLE 統(tǒng)計(jì)數(shù)據(jù)以表格形式呈現(xiàn)。然后通過 MLE 繪圖以圖形方式診斷所得估計(jì)值。
plot(Dseans, u.rg=c(0.3, 0.35))
第 4b 節(jié) - POT 的 VaR 預(yù)測(cè)
POT 數(shù)據(jù)的風(fēng)險(xiǎn)價(jià)值 (VaR) 估計(jì)是通過將 10 個(gè)股票指數(shù) MLE 數(shù)據(jù)轉(zhuǎn)換為時(shí)間序列來創(chuàng)建的。VaR 估計(jì)是根據(jù) MLE 時(shí)間序列數(shù)據(jù)進(jìn)行的。未來值的預(yù)測(cè)(未來 100 天和 500 天)是從 MLE VaR 數(shù)據(jù)推斷出來的。在結(jié)果圖中,藍(lán)色圓圈表示未來 100 天的值,紅色圓圈表示 500 天的收益值。
VAR(merts, p = 2, tp = "cost")
# 預(yù)測(cè)未來125天、250天和500天
mle_r.pd <- prect(e.ar, n.ahad = 100, ci = 0.9)
plot(mea.prd)

第 4c 部分 - POT 的期望損失ES (CvaR) 預(yù)測(cè)
然后計(jì)算10只股票指數(shù)MLE數(shù)據(jù)的條件風(fēng)險(xiǎn)值("CvaR "或 "期望損失ES")。數(shù)據(jù)的時(shí)間序列被用來尋找最差的0.95%的跌幅的最大值。通過極端分布的 "修正 "方法,計(jì)算出 "期望損失ES",兩種計(jì)算的結(jié)果都以表格形式呈現(xiàn)。
# 最差的0.95%最大回撤的平均值
mdM <- maxdadw(mlvs[,2])
CvaR(ldaa), p=0.95, meto="mdii",
pimeod = "comnen", weghts)
?

第 4d 節(jié) - 峰值超過閾值的 Hill 估計(jì)
Hill 估計(jì)(用于尾部指數(shù)的參數(shù)估計(jì))驗(yàn)證 10 只股票的 MLE 數(shù)據(jù)是一個(gè)極值分布。

第 4e 節(jié) - 正態(tài)分布的 Anderson-Darling 檢驗(yàn)
Anderson-Darling 檢驗(yàn)是確定大樣本數(shù)量分布的非正態(tài)性的有力決定因素。如果 P 值小于 0.05,則分布與正態(tài)性不同。此測(cè)試的結(jié)果 P 值為 3.7^-24。

第 4f 節(jié) - 結(jié)果表
最后,給出了 10 個(gè)股票指數(shù) MLE 未來價(jià)值的估計(jì)結(jié)果表。3 個(gè) MLE VaR 估計(jì)值(和 MLE 期望損失ES)的點(diǎn)估計(jì)值和范圍被制成表格來比較。

第 4g 節(jié) - 峰值超過閾值的 100 天 GARCH 預(yù)測(cè)
通過將 MLE(10 只股票指數(shù)的最大似然估計(jì))擬合到 GARCH(1,1)(廣義自回歸條件異型性)模型,對(duì)峰值超過閾值 EVT 數(shù)據(jù)進(jìn)行預(yù)測(cè)。顯示預(yù)測(cè)公式參數(shù)表。創(chuàng)建了一個(gè)“自相關(guān)函數(shù)”(ACF)圖,顯示了隨時(shí)間變化的重要事件。然后,顯示擬合模型結(jié)果的一組圖。然后創(chuàng)建對(duì)接下來 20 天(股票指數(shù)表現(xiàn))的預(yù)測(cè)。最后,20 天的預(yù)測(cè)(來自峰值超過閾值 EVT extimation)顯示在 2 個(gè)圖中。
fit(ec,ta, slvr = 'hybrid')
plot(pot.fite.ol)



?
第 5a 節(jié) - 估計(jì)方法影響表
下表匯總了檢驗(yàn) 極值分布的 10 個(gè)股票的四種方法的結(jié)果。第一列包含四種估計(jì)方法的名稱。提供了 VaR、ES、mu統(tǒng)計(jì)量和 Anderson-Darling P 值的統(tǒng)計(jì)量。
c("VaR",
round(mean(cofets),4),
"NA", "NA", p.vau)
c("Block Maxm", round(mean(coffies),4),
MES, pr.ss[3],.vle)
c("POT",
round(mean(cofies), 4),
MES, fitdaes, p.ale)

?
第 5b 節(jié) - 結(jié)論
在對(duì) 10 家公司(在 DAX 證券交易所上市)的 10 年股票收益率進(jìn)行檢查后,確認(rèn)將收益率百分比的變化表征為極值分布的有效性。四種分析方法的擬合值的所有 Anderson-Darling 檢驗(yàn)都顯示分布具有正態(tài)性或所有非極值值的概率不顯著。這些方法在收益數(shù)據(jù)中的風(fēng)險(xiǎn)價(jià)值方面是一致的。Block Maxima 方法會(huì)產(chǎn)生 VaR 估計(jì)的輕微偏差。傳統(tǒng)的 VaR 估計(jì)和 POT 估計(jì)產(chǎn)生相同的風(fēng)險(xiǎn)價(jià)值。與股票收益率數(shù)據(jù)的傳統(tǒng) CvaR 估計(jì)相比,這 2 種 EVT 方法預(yù)測(cè)的預(yù)期缺口較低。標(biāo)準(zhǔn) QQ 圖表明峰值超過閾值是最可靠的估計(jì)方法,
在對(duì)10家公司(在德國(guó)DAX證券交易所上市)10年的股票收益率進(jìn)行檢查后,證實(shí)了將收益率變化定性為極值分布的有效性。對(duì)四種分析方法的擬合值進(jìn)行的所有安德森-達(dá)林測(cè)試顯示,分布具有正態(tài)性或所有非極值的概率不大。這些方法在收益數(shù)據(jù)的風(fēng)險(xiǎn)值方面是一致的。分塊最大值方法產(chǎn)生了一個(gè)風(fēng)險(xiǎn)值估計(jì)的偏差。傳統(tǒng)的VaR估計(jì)和POT估計(jì)產(chǎn)生相同的風(fēng)險(xiǎn)值。相對(duì)于傳統(tǒng)的股票收益率數(shù)據(jù)的CvaR估計(jì),兩種EVT方法預(yù)測(cè)的期望損失較低。標(biāo)準(zhǔn)Q-Q圖表明,在10只股票的指數(shù)中,Peaks-Over-Threshold是最可靠的估計(jì)方法。

最受歡迎的見解
1.R語言基于ARMA-GARCH-VaR模型擬合和預(yù)測(cè)實(shí)證研究
2.R語言時(shí)變參數(shù)VAR隨機(jī)模型
3.R語言估計(jì)時(shí)變VAR模型時(shí)間序列的實(shí)證研究
4.R語言基于ARMA-GARCH過程的VAR擬合和預(yù)測(cè)
5.GARCH(1,1),MA以及歷史模擬法的VaR比較
6.R語言用向量自回歸(VAR)進(jìn)行經(jīng)濟(jì)數(shù)據(jù)脈沖響應(yīng)
7.R語言實(shí)現(xiàn)向量自動(dòng)回歸VAR模型
8.R語言隨機(jī)搜索變量選擇SSVS估計(jì)貝葉斯向量自回歸(BVAR)模型
9.R語言VAR模型的不同類型的脈沖響應(yīng)分析