拓端tecdat|R語言有狀態(tài)依賴強(qiáng)度的非線性、多變量跳躍擴(kuò)散過程模型似然推斷分析股票
原文鏈接:http://tecdat.cn/?p=23010?
原文出處:拓端數(shù)據(jù)部落公眾號
跳躍擴(kuò)散過程為連續(xù)演化過程中的偏差提供了一種建模手段。但是,跳躍擴(kuò)散過程的微積分使其難以分析非線性模型。本文開發(fā)了一種方法,用于逼近具有依賴性或隨機(jī)強(qiáng)度的多變量跳躍擴(kuò)散的轉(zhuǎn)移密度。通過推導(dǎo)支配過程時(shí)變的方程組,我們能夠通過密度因子化來近似轉(zhuǎn)移密度,將跳躍擴(kuò)散的動(dòng)態(tài)與無跳躍擴(kuò)散的動(dòng)態(tài)進(jìn)行對比。在這個(gè)框架內(nèi),我們開發(fā)了一類二次跳躍擴(kuò)散,我們可以計(jì)算出對似然函數(shù)的精確近似。隨后,我們分析了谷歌股票波動(dòng)率的一些非線性跳躍擴(kuò)散模型,在各種漂移、擴(kuò)散和跳躍機(jī)制之間進(jìn)行。在此過程中,我們發(fā)現(xiàn)了周期性漂移和依賴狀態(tài)的跳躍機(jī)制的依據(jù)。
簡介
現(xiàn)實(shí)世界的過程經(jīng)常受到許多隨機(jī)輸入源的影響,導(dǎo)致各種隨機(jī)行為,形成過程軌跡的一個(gè)組成部分。因此,在對這種現(xiàn)象進(jìn)行建模時(shí),模型方程必須考慮到過程動(dòng)態(tài)的各種隨機(jī)性來源。
盡管擴(kuò)散過程在連續(xù)過程的建模中被廣泛使用,但通常假設(shè)布朗運(yùn)動(dòng)作為過程隨機(jī)演化的驅(qū)動(dòng)機(jī)制。如果布朗運(yùn)動(dòng)不夠,可以對模型過程進(jìn)行概括,使其應(yīng)用更加實(shí)際。
一個(gè)這樣的概括是在模型過程的軌跡中包括隨機(jī)發(fā)生的 "跳躍"。這種修改主要是在金融背景下進(jìn)行的,其中擴(kuò)散模型被用來描述價(jià)格/資產(chǎn)過程的動(dòng)態(tài),這些價(jià)格/資產(chǎn)過程在觀察到的時(shí)間序列中會出現(xiàn)看似自發(fā)的頻繁跳動(dòng)。例如,人們通常假設(shè)一個(gè)給定的股票價(jià)格過程的對數(shù)收益為正態(tài)分布。通過假設(shè)股票價(jià)格過程的動(dòng)態(tài)變化遵循幾何布朗運(yùn)動(dòng),這一假設(shè)可以很容易地被納入隨機(jī)微分方程中。
其中Xt表示時(shí)間t的股票價(jià)格,由此可見,對數(shù)(Xt)-對數(shù)(Xs)~N((μ-σ2/2)(t-s), σ2(t-s)),對于t>s。然而,股票價(jià)格收益率的正態(tài)性長期以來一直受到爭議,經(jīng)驗(yàn)證據(jù)表明,收益率往往表現(xiàn)出正態(tài)分布不能很好復(fù)制的特征。其中最廣為人知的是模型過程中明顯缺乏重尾的現(xiàn)象。這一點(diǎn)可以通過計(jì)算描述性的統(tǒng)計(jì)數(shù)據(jù)來證明,比如觀察到的收益率序列的偏度和峰度,隨后可以與正態(tài)分布下的相應(yīng)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行對比。在擴(kuò)散過程的背景下,這種差異通常是通過建立隨機(jī)波動(dòng)率模型來彌補(bǔ)的,其中收益過程的擴(kuò)散系數(shù)本身被視為一個(gè)隨機(jī)過程。也就是說,修改后的過程可以采取以下形式:
其中a(σ 2 t , t)和b(σ 2 t , t)分別表示方差過程的漂移和擴(kuò)散,B (1) t和B (2) t是相關(guān)的布朗運(yùn)動(dòng)。隨機(jī)波動(dòng)率模型通過允許對數(shù)收益的方差隨時(shí)間變化,更準(zhǔn)確地捕捉股票價(jià)格收益的尾部行為。
然而,在解釋隨機(jī)波動(dòng)率機(jī)制時(shí)需要注意。事實(shí)上,當(dāng) B (1) t 和 B (2) t 不相關(guān)時(shí),對數(shù)收益過程的邊際分布是以方差過程的已知初始值為條件的(即Xt|Xs, σ2 s for t > s),仍然是正態(tài)分布,即存在強(qiáng)相關(guān),在這種情況下,對數(shù)收益的邊際分布可能是偏斜的,尾部比正態(tài)分布下預(yù)測的略厚,由此產(chǎn)生的轉(zhuǎn)移密度可能沒有足夠的leptokurtic來解釋短轉(zhuǎn)移期內(nèi)的極端收益事件。
為了說明這一點(diǎn),考慮對標(biāo)準(zhǔn)普爾500指數(shù)(S&P 500)的每日對數(shù)收益的滾動(dòng)估計(jì)。讓Xti表示標(biāo)準(zhǔn)普爾500指數(shù)在時(shí)間ti的值,然后用帶寬h定義一個(gè)峰度滾動(dòng)估計(jì)值。?
圖描述了峰度的滾動(dòng)估計(jì)和時(shí)間差估計(jì),計(jì)算為{K(ti, h) - K(ti-1, h) : i = h, h + 1, . . N},在1990-01-01至2015-12-31的時(shí)間段內(nèi)使用h=250天的帶寬。在這個(gè)帶寬下,差分序列代表了將滾動(dòng)估計(jì)值向前移動(dòng)一天所引起的估計(jì)峰度的變化,即(大約)過去一年的數(shù)據(jù)。此外,我們還將峰度的總體估計(jì)值(在整個(gè)時(shí)間段內(nèi)計(jì)算)與正態(tài)分布的估計(jì)值疊加在一起。
根據(jù)總體估計(jì),樣本的峰度明顯超過了正態(tài)分布的估計(jì)。然而,一年的滾動(dòng)估計(jì)顯示,盡管對數(shù)收益系列的峰度通常高于正態(tài)分布的峰度,但總體估計(jì)的規(guī)??蓺w因于一些極端收益事件的發(fā)生。這些事件表現(xiàn)為峰度的滾動(dòng)估計(jì)值中突然出現(xiàn)的尖峰,在時(shí)間差的估計(jì)值中可以清楚地看到。
為了解釋這種極端事件,Merton(1976)提出在擴(kuò)散軌跡中加入跳躍,以便建立一個(gè)比幾何布朗運(yùn)動(dòng)的連續(xù)路徑所預(yù)測的更精確的資產(chǎn)價(jià)格回報(bào)模型,在這種情況下,修改后的隨機(jī)微分方程(SDE)的形式為
其中z˙t表示正態(tài)分布的跳躍隨機(jī)變量,Nt是強(qiáng)度恒定的泊松過程,即Nt-Ns~Poi(λ(t - s))。在這種表述下,極端事件被明確地包含在隨機(jī)微分方程中,作為擴(kuò)散軌跡中隨機(jī)發(fā)生的不連續(xù)跳躍。因此,觀察到的對數(shù)收益的尾部行為和布朗運(yùn)動(dòng)的尾部行為之間的差異,通過加入跳躍機(jī)制得到了緩解。在此基礎(chǔ)上,我們可以擴(kuò)展該模型,以建立一個(gè)帶有跳躍的隨機(jī)波動(dòng)率模型,例如:
其中跳躍同時(shí)影響著收益率和波動(dòng)率。利用這一點(diǎn),可以保留隨機(jī)波動(dòng)率的有用特性,同時(shí)直接說明極端收益事件和波動(dòng)率的跳躍。
標(biāo)量的例子
為了證明矩量方程在分析跳躍擴(kuò)散模型中的應(yīng)用,我們考慮一個(gè)具有隨機(jī)強(qiáng)度的非線性、時(shí)間不均一的跳躍擴(kuò)散。設(shè)
λ(Xt, r˙t, t) = r˙t,其中強(qiáng)度參數(shù)r˙t的動(dòng)態(tài)變化由連續(xù)時(shí)間馬爾科夫鏈(CTMC)給出。?
?
轉(zhuǎn)移率矩陣
?
在方程的動(dòng)態(tài)作用下,該過程表現(xiàn)出線性漂移和波動(dòng),隨時(shí)間周期性變化。此外,該過程還受到隨機(jī)發(fā)生的跳躍事件的影響,跳躍強(qiáng)度隨時(shí)間在λ1和λ2之間隨機(jī)轉(zhuǎn)換。我們需要評估強(qiáng)度過程隨時(shí)間變化的期望值。從˙rt的轉(zhuǎn)移概率矩陣中,可以得到?
圖將得到的近似值與不同時(shí)間點(diǎn)的模擬軌跡計(jì)算的頻率分布進(jìn)行了比較。與矩方程一樣,轉(zhuǎn)移密度近似值似乎準(zhǔn)確地復(fù)制了指定時(shí)間段內(nèi)的轉(zhuǎn)移密度。周期性波動(dòng)的影響可以從轉(zhuǎn)移密度曲面的振蕩形狀中看出。?
?
?
通過重復(fù)計(jì)算不同初始條件下的轉(zhuǎn)移密度近似值--我們不是從低跳頻狀態(tài)開始,而是讓過程從高跳頻狀態(tài)開始--我們可以直觀地看到隨機(jī)強(qiáng)度的影響。圖比較了強(qiáng)度過程的兩個(gè)初始狀態(tài)的近似過渡密度。在高強(qiáng)度制度下,過渡密度明顯比低強(qiáng)度制度下更偏斜。這是很直觀的,因?yàn)楸M管無論強(qiáng)度過程的狀態(tài)如何,跳躍分布都是固定的,但在假定的參數(shù)集下,跳躍通常會假設(shè)正值。
因此,如果跳躍發(fā)生得更頻繁,那么與低強(qiáng)度區(qū)制下相比,該過程很可能在某一特定時(shí)間內(nèi)從其初始狀態(tài)進(jìn)一步傳播。注意到,盡管強(qiáng)度過程轉(zhuǎn)換回低強(qiáng)度狀態(tài)的概率不為零,但與從低強(qiáng)度狀態(tài)開始相比,平均而言,在轉(zhuǎn)移期的持續(xù)時(shí)間內(nèi),強(qiáng)度預(yù)計(jì)會更高。這可以通過比較假設(shè)參數(shù)下強(qiáng)度過程的兩個(gè)初始狀態(tài)的h(t, λ, β)來驗(yàn)證。?
得到的參數(shù)估計(jì)值與真實(shí)的參數(shù)集相當(dāng)吻合,但μz21是個(gè)明顯的例外。然而,仔細(xì)檢查發(fā)現(xiàn),在跳躍擴(kuò)散模型下計(jì)算出的估計(jì)值確實(shí)是一個(gè)有效的估計(jì)值,因?yàn)橹苯訌奶S實(shí)現(xiàn)中計(jì)算出的值是相當(dāng)相似的。事實(shí)上,在這個(gè)實(shí)驗(yàn)中,跳躍信號是相當(dāng)強(qiáng)的,因?yàn)樘S分布的分散性相對于擴(kuò)散參數(shù)來說是很大的。因此,跳躍和擴(kuò)散動(dòng)態(tài)之間的對比度很高,足以對跳躍區(qū)制的動(dòng)態(tài)做出相當(dāng)準(zhǔn)確的推斷。
盡管估計(jì)的參數(shù)接近真實(shí)的參數(shù)集,但在模擬中產(chǎn)生的特定的跳躍實(shí)現(xiàn)序列包含在真實(shí)參數(shù)集下相對不可能的值。盡管這樣,跳躍區(qū)制的參數(shù)仍然可以被準(zhǔn)確地提取出來,盡管保留了不可能的跳躍序列的屬性。
對谷歌股票價(jià)格波動(dòng)的應(yīng)用
在次貸危機(jī)后的世界里,投資者已經(jīng)越來越意識到了解股票價(jià)值的大幅波動(dòng)對投資組合和金融產(chǎn)品的影響的重要性。因此,分析金融數(shù)據(jù)的技術(shù)已經(jīng)變得越來越復(fù)雜,而且往往側(cè)重于更好地管理與極端事件相關(guān)的風(fēng)險(xiǎn)和機(jī)會,包括在高頻和低頻交易范圍內(nèi)。
與此同時(shí),數(shù)據(jù)市場也有了類似的發(fā)展,成千上萬的經(jīng)濟(jì)變量和股票的高度詳細(xì)數(shù)據(jù)幾乎可以免費(fèi)獲得。期權(quán)交易所(CBOE)發(fā)布了在主要證券交易所上市的一些大盤股的波動(dòng)率指數(shù)。通過使用諸如S & P 500波動(dòng)率指數(shù),這些股票波動(dòng)率指數(shù)可以量化單個(gè)股票價(jià)格過程的波動(dòng)性,而不是股票指數(shù)的波動(dòng)。
事實(shí)上,單個(gè)股票過程的動(dòng)態(tài)可能與一組股票的總體動(dòng)態(tài)有很大的不同。因此,股票波動(dòng)率指數(shù)在量化投資組合中的風(fēng)險(xiǎn)敞口方面非常有用,這些投資組合對此類股票和相關(guān)過程有大量投資。通過使用各種跳躍擴(kuò)散模型,我們試圖對互聯(lián)網(wǎng)搜索巨頭谷歌的股票波動(dòng)率進(jìn)行建模。
圖顯示了谷歌股票波動(dòng)率(VXGOG)從2010年開始到2015年底的軌跡,以每日為單位進(jìn)行采樣。在接下來的分析中,我們以年為單位來衡量時(shí)間,并使用準(zhǔn)確的日期來觀察,以構(gòu)建連續(xù)觀察的轉(zhuǎn)移期限。
為了對波動(dòng)率時(shí)間序列進(jìn)行建模,我們定義了一些嵌套在SDE中的跳躍擴(kuò)散模型。
跳躍強(qiáng)度為λθ(Xt, t),旨在復(fù)制波動(dòng)率序列的突出特征和動(dòng)態(tài)變化。利用廣義二次方程框架,我們可以為方程建立一個(gè)模板,可以用來擬合各種形式的漂移、擴(kuò)散和跳躍。為了對波動(dòng)率序列的漂移進(jìn)行建模,我們使用了線性均值回歸的漂移結(jié)構(gòu)。
請注意,先驗(yàn)參數(shù)大多是無信息的,然而,它們確實(shí)有助于將相關(guān)參數(shù)限制在適當(dāng)?shù)念I(lǐng)域內(nèi)。例如,θ8被限制在[0,1]區(qū)間內(nèi),否則似然會包含多個(gè)相同的模型。我們可以將跳躍擴(kuò)散過程擬合到觀察到的序列中,并計(jì)算出參數(shù)估計(jì)值。?
從建模的角度來看,通過比較模型與傳統(tǒng)擴(kuò)散模型的擬合,可以清楚地看到跳躍式擴(kuò)散的使用。例如,與它的無跳躍對應(yīng)模型--股票波動(dòng)率的時(shí)間同質(zhì)性CIR模型相比。
與DIC的比較顯示了擬合度的大幅提高。
盡管參數(shù)估計(jì)值可以說明過程的跳躍區(qū)制的動(dòng)態(tài),但JGQD.mcmc()函數(shù)為評估跳躍事件的概率提供了一個(gè)有用的統(tǒng)計(jì)數(shù)字。從模型輸出中,我們可以訪問列表變量,它給出了在MCMC運(yùn)行的每個(gè)迭代中觀察到至少一次跳躍的估計(jì)平均概率。因此,我們可以畫出上述概率的頻率直方圖,以便深入了解一個(gè)典型轉(zhuǎn)移跳躍到來的擬合概率。?
根據(jù)直方圖,我們可以預(yù)期在任何一個(gè)交易日看到至少一次波動(dòng)率的跳躍,概率約為6.5%。
作為參考,我們還疊加了每個(gè)轉(zhuǎn)移區(qū)間的跳躍概率的解碼序列。也就是說,我們估計(jì)了每個(gè)觀察到的轉(zhuǎn)移期包含跳躍的概率(基于基礎(chǔ)模型),并人為地選擇了預(yù)(后)測的跳躍到達(dá)的時(shí)間序列。這是通過強(qiáng)加一個(gè)啟發(fā)式規(guī)則來實(shí)現(xiàn)的,即90%或更高的包含跳躍的估計(jì)概率(包含在模型輸出列表變量中)被認(rèn)為是檢測跳躍事件的決定性因素。盡管不嚴(yán)格,但對探索性分析很有用。
從圖上看,估計(jì)的到達(dá)時(shí)間似乎與波動(dòng)率序列中的大幅波動(dòng)相吻合。具體來說,一些解碼的到達(dá)似乎是結(jié)構(gòu)性的,在波動(dòng)率周期性上升之后觀察到波動(dòng)率的下降......更深入的分析將在接下來的研究中進(jìn)行,但要考慮以下幾點(diǎn)。
?
最受歡迎的見解
1.在python中使用lstm和pytorch進(jìn)行時(shí)間序列預(yù)測
2.python中利用長短期記憶模型lstm進(jìn)行時(shí)間序列預(yù)測分析
3.使用r語言進(jìn)行時(shí)間序列(arima,指數(shù)平滑)分析
4.r語言多元copula-garch-模型時(shí)間序列預(yù)測
5.r語言copulas和金融時(shí)間序列案例
6.使用r語言隨機(jī)波動(dòng)模型sv處理時(shí)間序列中的隨機(jī)波動(dòng)
7.r語言時(shí)間序列tar閾值自回歸模型
8.r語言k-shape時(shí)間序列聚類方法對股票價(jià)格時(shí)間序列聚類
9.python3用arima模型進(jìn)行時(shí)間序列預(yù)測