拓端tecdat|R語言用綜合信息準(zhǔn)則比較隨機(jī)波動率(SV)模型對股票價格時間序列建模
原文鏈接:http://tecdat.cn/?p=23882
原文出處:拓端數(shù)據(jù)部落公眾號
摘要
隨機(jī)波動率(SV)模型是常用于股票價格建模的一系列模型。在所有的SV模型中,波動率都被看作是一個隨機(jī)的時間序列。然而,從基本原理和參數(shù)布局的角度來看,SV模型之間仍有很大的不同。因此,為一組給定的股票價格數(shù)據(jù)選擇最合適的SV模型對于對股票市場的未來預(yù)測非常重要。為了實現(xiàn)這一目標(biāo),可以使用留一交叉驗證(LOOCV)方法。然而,LOOCV方法的計算成本很高,因此它在實踐中的應(yīng)用非常有限。在對SV模型的研究中,我們提出了兩種新的模型選擇方法,即綜合廣泛適用信息準(zhǔn)則(iWAIC)和綜合重要性抽樣信息準(zhǔn)則(iIS-IC),作為近似LOOCV結(jié)果的替代品。在iWAIC和iIS-IC方法中,我們首先計算每個觀測值的期望似然,作為相對于相應(yīng)的潛變量(當(dāng)前的對數(shù)波動參數(shù))的積分。由于觀測值與相應(yīng)的潛變量高度相關(guān),每個第 t 個觀測值(y obs t)的綜合似然值期望接近于以 y obs t 為保持?jǐn)?shù)據(jù)的模型所計算的 y obs t 的期望似然值。其次,在計算信息標(biāo)準(zhǔn)時,綜合期望似然被用作期望似然的替代。由于相對于潛變量的整合在很大程度上減少了模型對相應(yīng)觀測值的偏差,因此整合后的信息標(biāo)準(zhǔn)有望接近LOOCV結(jié)果。為了評估iWAIC和iIS-IC的性能,我們首先使用模擬數(shù)據(jù)集進(jìn)行了實證研究。該研究結(jié)果表明,iIS-IC方法比傳統(tǒng)的IS-IC有更好的性能,但iWAIC的性能并不優(yōu)于非綜合WAIC方法。隨后,利用股票市場收益數(shù)據(jù)進(jìn)行了進(jìn)一步的實證研究。根據(jù)模型的選擇結(jié)果,對于給定的數(shù)據(jù),最好的模型是具有兩個獨立自回歸過程的SV模型,或者是具有非零預(yù)期收益的SV模型。
緒論
1.1 隨機(jī)波動率模型
隨機(jī)波動率(SV)模型被廣泛用于股票價格的建模,Taylor(1982)和 Hull 和 White(1987)在期刊上發(fā)表的論文中對此進(jìn)行了描述。在基本的隨機(jī)波動率模型中,均值修正后的每日連續(xù)復(fù)利收益yt可以被建模為具有隨機(jī)波動率的正態(tài)分布。與指數(shù)加權(quán)移動平均數(shù)(EWMA)模型和廣義自回歸條件異方差(GARCH)模型不同,對數(shù)波動率在 SV 模型中被視為馬爾可夫過程。
作為馬爾可夫過程的結(jié)果,對數(shù)波動率本身成為一個隨機(jī)過程。因此,SV 模型不需要像其他一些模型(即 Black 和 Scholes (1973)提出的著名的 Black-Scholes 模型)那樣假設(shè)恒定波動率或固定波動率過程。由于波動率確實會隨著時間的推移而變化,因此假設(shè)波動率不變是許多非 SV 模型的主要缺陷,特別是當(dāng)時間跨度較長時。因此,在對股票價格和其他一些具有變化的波動率的衍生品進(jìn)行建模時,SV 模型往往是一個很好的選擇。
除了基本模型外,許多擴(kuò)展的SV模型也被用于股票價格建模的目的,如Harvey等人(1994);Shephard(1996);Gallant和Tauchen(1996);Chernov等人(2003)發(fā)表的論文中所述。
在這篇論文中,對八個不同的模型進(jìn)行了測試和比較,用于股票價格的建模。每個測試的模型都是基本的SV模型或其變體。
為了使用馬爾科夫鏈蒙特卡洛方法從SV模型參數(shù)的后驗分布中取樣,我們需要知道一個與后驗分布成正比的函數(shù)。為了實現(xiàn)這一目標(biāo),研究中使用了貝葉斯推斷法。根據(jù)貝葉斯規(guī)則,給定模型參數(shù)π(θ)的先驗分布和一組觀測數(shù)據(jù)D,模型參數(shù)的后驗分布與模型參數(shù)的后驗似然函數(shù)f(D|θ)π(θ)和模型參數(shù)先驗分布的乘積成正比。
隨機(jī)波動率模型和模型擬合過程
2.1 隨機(jī)波動率模型
公司股票的價格是由實體產(chǎn)生未來現(xiàn)金流的能力決定的,同時也受到股票供求關(guān)系的影響。如果我們對某只股票進(jìn)行投資,那么在一段時間內(nèi)對該股票的投資利潤就稱為該股票的收益率。在實踐中,股票的收益率與股票的波動性密切相關(guān)。如果yt是連續(xù)復(fù)利的收益率,那么二者之間的關(guān)系可以用以下公式來模擬。
股價波動率是衡量標(biāo)的資產(chǎn)價格變化(上升或下降)的預(yù)期幅度,這是股票的一個非常重要的特征。某只股票的波動率對于預(yù)測股票本身的價格以及許多其他與股票有關(guān)的衍生品是至關(guān)重要的。例如,根據(jù)著名的布萊克-斯科爾斯模型,當(dāng)標(biāo)的股票的隱含波動率較高時,某只股票的歐洲看漲期權(quán)(具有相同的執(zhí)行價格和到期日)需要更多的權(quán)利金(更有價值)(Black and Scholes, 1973)。此外,從風(fēng)險管理的角度來看,股票的波動率需要用來確定投資組合的風(fēng)險值(VaR)(Giot 和 Laurent,2004)。
諸如歷史模擬的傳統(tǒng)方法可能無法識別波動率的變化,廣義自回歸條件異方差(GARCH)模型因此經(jīng)常被用來預(yù)測未來的波動率(Engle, 1982; Bollerslev, 1986)。例如,在 GARCH(1,1)模型中,波動率 σ 2 t 按照以下公式計算。
隨機(jī)波動率(SV)模型是GARCH模型在股票價格波動率建模中的替代品(Taylor,1982;Hull和White,1987)。在 SV 模型中,波動率被認(rèn)為是一個隨機(jī)過程。通過允許過程中的隨機(jī)性,SV模型在理論上有更多的好處。在這項研究中,我們測試了幾個自回歸隨機(jī)波動率(AR-SV)模型,這是一個流行的SV模型的子類別。在基本的AR-SV模型中,波動率的對數(shù),ht=log(σt),被建模為一個隨機(jī)的自回歸過程。
這也可以寫成
鑒于對數(shù)波動率,每日股票收益率yt可以被建模為
模型1
這個模型是我們之前提到的基本 AR-SV 模型。調(diào)整對數(shù)波動率過程的狀態(tài)方程為:
和日收益率的觀察方程方程為
模型2
模型 2 是基本 SV 模型的一個變種。在這個模型中,對數(shù)波動率的狀態(tài)方程與基本的 AR-SV 模型相同,但是每日收益率的平均值?
yt是α(非零)而不是零:
模型3
在這個模型中,對數(shù)波動率ht遵循一個AR(2)過程
這個方程最適合用來模擬具有較低自相關(guān)性的滯后-1 對數(shù)波動率過程。根據(jù) Yule-Walker 方程(Cheng, 2005),對于這個 AR(2)過程中的任何 ht,滯后-1 自身相關(guān)(ht 和 ht-1 之間的相關(guān)性)是 ht-1 的系數(shù),也就是 φ。另一方面,滯后n自相關(guān)(ht和ht-n之間的相關(guān)性)由φ n + ψ n-1給出。因此,該模型表明當(dāng)前的對數(shù)波動率與它的滯后-1 對數(shù)波動率的相關(guān)性較小,但與所有其他的滯后對數(shù)波動率的相關(guān)性較大。
模型4
該模型由兩個獨立的AR(1)過程組成,如Harvey等人所述。
在這個模型中,對數(shù)波動率 ht 由 μ + h (1) t + h (2) t 給出,h (1) t 和 h (2) t 是兩個獨立的 AR(1) 過程。
模型5
模型5允許ut和vt+1之間存在相關(guān)性,這導(dǎo)致yt的不對稱效應(yīng)。這種ut和vt+1之間的相關(guān)性早已被Black(1976)以及Engle和Ng(1993)所注意。在 Engle 和 Ng(1993)之前完成的一項研究中,發(fā)現(xiàn)收益沖擊對波動率有一定的影響。因此,假設(shè)二者之間存在關(guān)聯(lián)性是合理的。在模型 5 中,該相關(guān)性由以下協(xié)方差矩陣描述。
因此,SV模型方程和ht的狀態(tài)方程可以寫成
模型6
在這個模型中,觀察方程中包含了一個跳躍成分(觀察值的額外隨機(jī)向上或向下運動)。此外,yt也受到其滯后觀測值yt-1的影響。
一般來說,這個模型表明當(dāng)前的收益率yt是由當(dāng)前的價格波動率、隨機(jī)跳躍的發(fā)生和之前的觀察值yt-1決定的。
模型7
與模型6類似,模型7也包括跳躍成分,但不包括前面的觀察。
模型7中所有參數(shù)的分布都與模型6中的參數(shù)相同。
? 模型8
為了得到這個模型,觀察方程中的高斯觀察誤差被自由度為ν的學(xué)生t分布所取代。
由于誤差是對稱的和非正態(tài)的,根據(jù)Andrews和Mallows(1974)的觀點,可以使用正態(tài)分布的比例混合進(jìn)行模型擬合。
2.2 擬合SV模型的貝葉斯推斷和馬爾科夫鏈蒙特卡洛抽樣法
由于似然函數(shù)的非分析形式,將經(jīng)典的統(tǒng)計推斷,如最大似然估計,應(yīng)用于SV模型是相當(dāng)困難的。為了克服這個問題,人們提出了幾種替代方法。例如,在Harvey等人(1994)提出的準(zhǔn)最大似然法中,通過將log(yt)的分布視為正態(tài)分布,得到了實際似然函數(shù)的近似值。然后,這個近似函數(shù)(準(zhǔn)最大似然函數(shù))被最大化,而不是實際似然函數(shù)。
在另一種被稱有效矩量法(EMM)的方法中,準(zhǔn)似然函數(shù)的導(dǎo)數(shù)被用作廣義矩法(GMM)的矩條件。然后通過最小化矩條件的準(zhǔn)則來計算EMM估計的參數(shù)。通過使用這個矩條件,而不是臨時選擇一些低階矩,EMM方法被認(rèn)為是更有效的(Andersen等人,1999)。
在我們的研究中,我們對SV模型采用了貝葉斯推斷法。根據(jù)貝葉斯規(guī)則,給定模型參數(shù)π(θ,h)的先驗分布和觀測數(shù)據(jù)y obs,模型參數(shù)的后驗分布可以表示為。
為了將模型擬合給定的數(shù)據(jù)集,我們使用馬爾科夫鏈蒙特卡洛(MCMC)方法從每個模型的參數(shù)的后驗分布中取樣。在MCMC過程中,模型參數(shù)是根據(jù)馬爾科夫鏈進(jìn)行抽樣的。馬爾科夫鏈?zhǔn)且粋€隨機(jī)過程,在一個給定的狀態(tài)空間中進(jìn)行狀態(tài)轉(zhuǎn)換。給定一個有限的狀態(tài)空間,當(dāng)鏈足夠長時,馬爾科夫鏈必然會達(dá)到一個穩(wěn)定狀態(tài)(不變分布)(Gilks,2005)。
比較隨機(jī)模型的統(tǒng)計方法
在研究股票市場數(shù)據(jù)和預(yù)測未來趨勢時,模型的選擇非常重要。通過使用正確的模型,可以更好地理解和解釋數(shù)據(jù)的屬性,從而可以做出更好的預(yù)測和估計。而在實踐中使用錯誤的模型,則可能導(dǎo)致本可避免的意外損失。
傳統(tǒng)的方法,包括平均平方誤差(MSE)和決定系數(shù)(R2),只衡量數(shù)據(jù)與模型的擬合程度。由于在一個模型中增加額外的參數(shù)通常會增加擬合度,這些方法往往有利于復(fù)雜的模型,可能會過度擬合數(shù)據(jù)。為了克服過度擬合的問題,引入了交叉驗證方法。交叉驗證方法包括將數(shù)據(jù)集劃分為兩個子集,用一個子集擬合模型,用另一個子集測試模型。盡管交叉驗證法似乎能夠完全解決過度擬合的問題,但這些方法耗時且成本高。另外,許多方法對模型的復(fù)雜性進(jìn)行了懲罰。
實證結(jié)果
4.1 仿真研究
在我們的第一個研究中,通過使用一組模擬數(shù)據(jù)集來測試模型選擇標(biāo)準(zhǔn)的性能。首先,我們從模型6生成了一個數(shù)據(jù)集,數(shù)據(jù)的真實模型是模型6。這個數(shù)據(jù)生成過程被重復(fù)了100次,生成了100個數(shù)據(jù)集。其次,每個模擬數(shù)據(jù)集都被單獨擬合到列出的所有候選SV模型中。最后,使用模型選擇標(biāo)準(zhǔn),包括DIC、nWAIC、nIS、iWAIC和iIS,來為模擬數(shù)據(jù)集選擇最佳模型。
在第一步,通過將模型6中的參數(shù)設(shè)置為一些特定的值來模擬數(shù)據(jù)集。在我們的特定情況下,用于數(shù)據(jù)生成的參數(shù)是:μ = -10,φ = 0.96,τ = 0.345,β = 0.1,κ = 0.08,δ = 0.03。每個模擬數(shù)據(jù)集是一個有2000個觀測值的時間序列。
一旦生成了數(shù)據(jù)集,我們隨后將候選的SV模型與數(shù)據(jù)進(jìn)行擬合。為了擬合這些模型,我們使用了馬爾科夫鏈蒙特卡洛(MCMC)方法,從每個模型的參數(shù)后驗中取樣。許多MCMC算法已經(jīng)被提出來對模型參數(shù)進(jìn)行抽樣,如Metropolis-Hastings算法和Gibbs采樣?;谶@些MCMC算法,開發(fā)了許多采樣軟件包,包括WinBUGS、OpenBUGS和JAGS(Lunn等人,2000;Spiegelhalter等人,2007;Plummer,2003)。然而,由于這些軟件包主要是基于Metropolis-Hastings算法,它們可能會因為算法中使用的隨機(jī)游走法提出新的狀態(tài)而出現(xiàn)收斂緩慢的問題。為了克服這個問題,開發(fā)了stan包(Carpenter等人,2015;Gelman等人,2015)。在stan中,通過應(yīng)用Hamilton Monte Carlo和no-U-turn采樣,收斂速度可以快得多(Carpenter等人,2015)。因此,我們決定在SV模型的特定研究中使用stan采樣器。
在使用stan采樣器對模型參數(shù)的后驗分布進(jìn)行采樣之前,我們需要先對參數(shù)進(jìn)行先驗分布。對于本研究中的所有SV模型,μ的先驗分布是正態(tài)的,均值為-10,標(biāo)準(zhǔn)差為5。此外,τ 2的先驗分布為反Gamma(2.5, 0.025)(Kim et al., 1998),對于所有的候選模型,φ的先驗分布都是在0和1之間均勻分布。對于模型2,參數(shù)α~N(0,10)的先驗,所有其他參數(shù)的先驗與基本SV模型相同。模型3中ψ的先驗分布與基本SV模型中φ的先驗分布相同(在0和1之間均勻分布)。在模型4中,參數(shù)φ2的先驗分布與基本SV模型中的φ相同。對于模型5,ρ的先驗分布在-1和1之間,均值為0,這給了相關(guān)參數(shù)ρ一個非信息性的先驗分布。模型6中的β參數(shù)衡量了當(dāng)前觀測對先前觀測的影響程度,該參數(shù)一般被認(rèn)為是小的。因此,我們對這個參數(shù)施加了β~N(0,0.2)的信息性先驗。同樣在模型6中,衡量觀察中發(fā)生跳躍(yt的額外向上或向下運動,可能發(fā)生也可能不發(fā)生)的概率的κ參數(shù)被賦予Beta(2, 100)先驗(Chib等人,2002)。另一方面,跳躍大小參數(shù)st的先驗分布為ln(1+st)~N(-δ 2/2, δ2),我們假定log(δ)的先驗分布為log(δ)~N(-3.07, 0.149)(Chib et al., 2002)。在模型8中,參數(shù)ν在[2, 128]上有一個均勻分布作為其先驗(Chib等人,2002)。
一旦模型參數(shù)的先驗值被設(shè)定,Stan采樣器讀取模擬觀測值(來自模型6),隨后對候選模型進(jìn)行擬合。為了確保馬爾科夫鏈的收斂,每個單獨的馬爾科夫鏈的采樣迭代次數(shù)被設(shè)定為20,000次。由于鏈可能需要一段時間來收斂,所以前10,000個樣本被放棄。為了減少相鄰樣本之間的自相關(guān),最后的樣本只包含其余10,000個樣本中的每10個樣本。此外,為了確保馬爾科夫鏈的收斂性,對每個模擬數(shù)據(jù)集同時運行兩個獨立的鏈。兩條鏈在同一組數(shù)據(jù)上的比較證實了馬爾科夫鏈在MCMC抽樣的前10,000個樣本之前就已經(jīng)收斂了。R?是對跨鏈變異與鏈內(nèi)變異的相對測量,接近1.0的值表明收斂性良好(Gelman等人,2011)。在我們的研究中,我們?yōu)槊總€后驗分布(基于給定模型的數(shù)據(jù)集)運行兩個單獨的馬爾可夫鏈,如果馬爾可夫鏈確實收斂,那么在收斂點之后,同一數(shù)據(jù)集的兩個鏈應(yīng)該表現(xiàn)出類似的模式。R?值大于1表明收斂不完善,R?值越大,收斂就越差。擬合模型(使用模擬數(shù)據(jù))的參數(shù)R?值大多非常接近1,表明這些模型的馬爾科夫鏈確實收斂了。
不過,一個例外是模型4中的φ(R?=53.8731)、τ(R?=2.8202)、φ2(R?=59.9186)和τ2(R?=2.9484)參數(shù)。這些大的R?值表明,馬爾科夫鏈在這個模型中收斂得并不好。然而,在這種特殊情況下,這個問題并不是一個大問題。在模型4中,我們有兩個獨立的AR(1)過程,它們具有相同的公式格式。因此,該模型包含兩個模式。如果一個模式包含h (1) t, φ, τ, h (2) t, φ2, τ2和所有其他參數(shù),那么另一個模式是通過保持所有其他參數(shù)不變而用h (2) t, φ, τ的值完全交換來形成的。因此,模型4的R?的高值是由兩個鏈?zhǔn)諗康絻蓚€不同的模式引起的(見圖4.2的例子)。由于這兩個模式彼此相距較遠(yuǎn),任何現(xiàn)有的采樣器都很難在這個特定的情況下探索參數(shù)空間。由于收斂到不同的模式會保持h(1)t+h(2)t的分布不變,而?yt的分布只取決于h(1)t和h(2)t的總和,所以整個模型對yt的預(yù)測是不受影響的。
表4.2中列出了擬合參數(shù)的值及其標(biāo)準(zhǔn)偏差。表中的結(jié)果顯示,模型參數(shù)的期望值基本符合數(shù)據(jù)生成參數(shù)的輪廓,這表明擬合效果良好。
##########################################
## ##下面的R代碼從模型6生成100組模擬數(shù)據(jù)。
## ##數(shù)據(jù)集生成就會存儲在當(dāng)前文件夾中。
##########################################
## y --- 模擬數(shù)據(jù)集。
for (ifold in 1:100){
s <- lss <- y<- h <- qq <- rep (0, T)
h[1] <- rnorm (1, mu + phi * (h0 - mu), tau)
for (t in 1:T) {lss[t] <- rnorm(1, -(delta^2)/2,delta^2); s[t] <- exp (lss[t] ) -
1}
##模型##########################################
## 下面的R代碼用rstan語言定義了模型1。
fit <- stan(model_code = model1, data = list(y = y, T = T), iter = 20000,
chains = 2, thin = 10)
每個跟蹤圖中的兩條鏈來自于基于模型6和同一組數(shù)據(jù)的兩條單獨模擬的馬爾可夫鏈??珂湻讲钆c預(yù)燒期后的鏈內(nèi)方差相比相對較小,表明馬爾科夫鏈的收斂性良好。
##########################################
## 下面的R代碼用rstan語言定義了模型4。
##########################################
model4 <-'
int<lower=1> T。
}
real<lower=0,upper=1> phi1。
real<lower=0,upper=1> phi2。
real<lower=0.0001> tausq;
real<lower=0.0001> tau2sq;
}
real<lower=0> tau。
real<lower=0> tau2。
tau <- sqrt(tausq);
tau2 <- sqrt(tau2sq);
}
mu ~ normal(-10,5);
h1[t] ~ normal(phi1*h1[t-1], tau);
h2[t] ~ normal(phi2*h2[t-1], tau2)。
##########################################
## 下面的R代碼使用HMC對給定的數(shù)據(jù)集進(jìn)行模型擬合
方法。
## ###從每組測試數(shù)據(jù)中產(chǎn)生兩個獨立的馬爾科夫鏈。
##########################################
fit <- stan(model_code = model4, data = list(y = y, T = T), iter = 20000,
當(dāng)兩個馬爾科夫鏈?zhǔn)諗康讲煌J綍r,模型4中φ和φ2的跟蹤圖實例。軌跡圖中的φ和φ2來自基于模型4和同一組數(shù)據(jù)的兩個單獨模擬的馬爾科夫鏈。與鏈內(nèi)方差相比,跨鏈方差很大,這是因為兩個鏈?zhǔn)諗康絻蓚€不同的模式。
當(dāng)stan采樣器完成模型參數(shù)的采樣后,使用DIC、WAIC、IS、iWAIC和iIS標(biāo)準(zhǔn)來進(jìn)行模型選擇。為了計算iIS和iWAIC的綜合似然,我們在每次迭代中對每個時間點t抽樣100個ht。這個隨機(jī)抽樣過程是根據(jù)計算出的ht |θ,h-t的分布完成的(詳見第三章)。當(dāng)?shù)玫絝(ht |θ,h-t)的樣本后,可以計算出相應(yīng)的log f(y obs t |θ,h-t)。為了計算這個綜合似然,我們將f(ht |θ,h-t)的樣本插入y obs t的概率函數(shù)中,一次一個,以計算每個迭代中每個時間點的y obs t的總共100個對數(shù)比例的概率。最后,100個y obs t的對數(shù)似然性的平均值將提供一個理想的綜合對數(shù)似然性log f(y obs t |θ,h-t)的良好估計。然而,對于模型5來說,f(ht |θ,h-t)的樣本不能輕易地從一個明確的分布中獲得,綜合對數(shù)似然的近似值是通過數(shù)字正交的方法計算的。
4.2 標(biāo)普100指數(shù)數(shù)據(jù)的實證研究
除了模擬研究,我們還使用了一組真實世界的股市數(shù)據(jù)(2010年9月至2015年8月的標(biāo)普100股票指數(shù)數(shù)據(jù))來擬合SV模型。標(biāo)準(zhǔn)普爾100指數(shù)包括100只股票,這些股票幾乎占股票市場市值的45%。這個股票子集在資本市場上發(fā)揮著重要作用,是衡量金融市場整體實力的一個良好指標(biāo)。因此,找到一個合適的方法來模擬標(biāo)準(zhǔn)普爾100指數(shù)數(shù)據(jù)是非常重要的。
在這項研究中,我們使用了2010年9月至2015年8月(1,258個交易日)標(biāo)普100指數(shù)(從雅虎財經(jīng)導(dǎo)出)的均值校正、連續(xù)復(fù)利的每日收益。總的來說,如圖4.3所示,這一時期的收益率上升,被認(rèn)為是2008年股市下跌后的 "復(fù)蘇期"。然而,由于經(jīng)濟(jì)狀況和貨幣政策的頻繁變化,股票市場的波動率在不同時期有很大的不同。因此,將SV模型應(yīng)用于股票市場數(shù)據(jù)是有意義的。
真實數(shù)據(jù)研究中的模型擬合過程與我們之前對模擬數(shù)據(jù)的研究相同。rstan軟件包被用來用股票市場數(shù)據(jù)擬合模型參數(shù)。馬爾科夫鏈的總迭代次數(shù)為20,000次,預(yù)燒期為10,000次。也就是說,前10,000個樣本被丟棄了。對于剩下的10,000個樣本,我們只保留每10個樣本,以減少自相矛盾。對每個模型中的數(shù)據(jù)集運行了兩條平行的馬爾科夫鏈,R?結(jié)果(詳見表4.5)顯示,馬爾科夫鏈在預(yù)燒期后收斂了。模型參數(shù)的R?值一般都接近于1,表明馬爾可夫鏈?zhǔn)諗啃Ч己谩?/p>
所有的擬合參數(shù)都列在模型參數(shù)表中,如表4.6所示。從該表提供的結(jié)果可以看出,有些模型參數(shù)的絕對值非常小,而方差卻很大,說明這些參數(shù)與0沒有顯著區(qū)別。如果是這樣,相應(yīng)的模型可能不是給定數(shù)據(jù)的好選擇。
當(dāng)我們從MCMC抽樣過程中得到模型參數(shù)樣本后,分別應(yīng)用DIC、nWAIC、iWAIC、nWAIC、nIS和iIS方法對模型進(jìn)行選擇(詳見模擬研究)。表4.7列出的結(jié)果顯示,除了iWAIC方法外,其他五種模型選擇標(biāo)準(zhǔn)都選擇了模型4作為給定股市指數(shù)數(shù)據(jù)的最佳模型。此外,DIC、nWAIC、nIS和iIS方法在模型的好壞排序上也提供了非常相似的結(jié)果。然而,nWAIC方法選擇了模型8作為最佳模型。同樣對于nWAIC方法,其余的排名結(jié)果也與其他的模型選擇標(biāo)準(zhǔn)非常不同。
結(jié)論和討論
總之,根據(jù)模擬數(shù)據(jù)研究,HMC方法在模型參數(shù)的后驗分布中取樣是成功的。在測試的模型選擇方法中,DIC方法的效果相當(dāng)好。DIC方法的良好表現(xiàn)可能是由于在大多數(shù)擬合的模型中,參數(shù)通常遵循多變量正態(tài)分布。此外,nIS也相當(dāng)一致,這表明重要性加權(quán)是糾正樂觀偏差的有效方法。此外,iIS 的結(jié)果顯示,與當(dāng)前對數(shù)波動率 ht 相關(guān)的積分是進(jìn)一步解決偏差問題的好方法。因此,iIS 方法能夠比 nIS 方法有所改進(jìn)。但是,綜合方法可能并不總是一個好的選擇,因為它的計算成本很高。最后,在所有測試的方法中,nWAIC和iWAIC的性能都是最差的,這使得它們的理論基礎(chǔ)值得懷疑。根據(jù)這項研究,我們可以知道這兩種WAIC方法可能無法通過其公式準(zhǔn)確地量化模型復(fù)雜性。
此外,對真實股市收益數(shù)據(jù)(2010年9月至2015年8月的標(biāo)普100指數(shù))的研究表明,根據(jù)模型選擇標(biāo)準(zhǔn),最佳模型是模型4,這表明數(shù)據(jù)序列遵循ARMA過程。然而,由于所有的選擇標(biāo)準(zhǔn)都對模型4有強(qiáng)烈的偏好,即使真實的模型不是模型4,選擇這個模型作為最佳模型可能是一個錯誤。因此,次好的模型,模型2(非零預(yù)期收益模型),也是真實模型的良好候選。
在我們的研究中,我們使用馬爾科夫鏈蒙特卡洛方法來擬合我們的隨機(jī)波動率模型,并隨后使用五個不同的模型選擇標(biāo)準(zhǔn)(DIC,nWAIC,nIS,iWAIC,iIS)來評估模型。為了檢驗?zāi)P蛿M合算法的可靠性和模型選擇方法的一致性,在使用任何真實數(shù)據(jù)之前,對模擬數(shù)據(jù)集做了初步研究。在模擬研究中,總共有100個數(shù)據(jù)集是由模型6單獨生成的,參數(shù)如下:μ = -10,φ = 0.96,τ = 0.345,β = 0.1,κ = 0.08,δ = 0.03。通過數(shù)據(jù)生成過程,我們既知道真實的模型,也知道模型參數(shù)的真實值。因此,我們能夠評估模型擬合方法的優(yōu)劣,以及模型選擇標(biāo)準(zhǔn)的一致性。
參考文獻(xiàn)
Alder, B. J. and Wainwright, T. (1959), “Studies in molecular dynamics. I. General method,” The Journal of Chemical Physics, 31, 459–466.
Andersen, H. C. (1980), “Molecular dynamics simulations at constant pressure and/or temperature,” The Journal of Chemical Physics, 72, 2384–2393.
Andersen, T. G., Chung, H.-J., and S?rensen, B. E. (1999), “Efficient method of moments estimation of a stochastic volatility model: A Monte Carlo study,” Journal of Econometrics, 91, 61–87.
Andrews, D. F. and Mallows, C. L. (1974), “Scale mixtures of normal distributions,” Journal of the Royal Statistical Society. Series B (Methodological), 36, 99–102.
最受歡迎的見解
1.HAR-RV-J與遞歸神經(jīng)網(wǎng)絡(luò)(RNN)混合模型預(yù)測和交易大型股票指數(shù)的高頻波動率
2.WinBUGS對多元隨機(jī)波動率模型:貝葉斯估計與模型比較
3.波動率的實現(xiàn):ARCH模型與HAR-RV模型
4.R語言ARMA-EGARCH模型、集成預(yù)測算法對SPX實際波動率進(jìn)行預(yù)測
5.使用R語言隨機(jī)波動模型SV處理時間序列中的隨機(jī)波動率
6.R語言多元COPULA GARCH 模型時間序列預(yù)測
7.R語言基于ARMA-GARCH過程的VAR擬合和預(yù)測
8.R語言隨機(jī)搜索變量選擇SSVS估計貝葉斯向量自回歸(BVAR)模型
9.R語言對S&P500股票指數(shù)進(jìn)行ARIMA + GARCH交易策略