最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

拓端tecdat|R語言股票收益分布一致性檢驗(yàn)KS檢驗(yàn)Kolmogorov-Smirnov、置換檢驗(yàn)Permuta

2022-02-04 13:32 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=25086?

原文出處:拓端數(shù)據(jù)部落公眾號(hào)

今年的收益是否真的與典型年份的預(yù)期不同?差異實(shí)際上與典型年份的預(yù)期不同嗎?這些都是容易回答的問題。我們可以使用均值相等或方差相等的測試。
但是下面這個(gè)問題呢。?

今年的收益概況與一般年份的預(yù)期情況是否不同?

這是一個(gè)更加普遍和重要的問題,因?yàn)樗ㄋ械臅r(shí)刻和尾部行為。而且它的答案也不那么簡單。

我在想一定有一種方法可以檢驗(yàn)收益密度之間的差異,而不僅僅是量化、可視化和用眼睛看。確實(shí)有這樣的方法。這篇文章的目的是展示如何正式檢驗(yàn)密度之間的平等。

事實(shí)上,至少有兩種方法可以檢驗(yàn)兩個(gè)密度或兩個(gè)分布之間的平等。第一種是比較經(jīng)典的。這種檢驗(yàn)被稱為Kolmogorov-Smirnov檢驗(yàn)。另一種是比較現(xiàn)代的,使用Permutation Test置換檢驗(yàn)(需要模擬)。我們展示這兩種方法。讓我們先拉出一些價(jià)格數(shù)據(jù)。


  1. end<- format(Sy.D, "%Y-%m-%d")

  2. l = lenh

  3. da0 <- lay

  4. Time <- index

  5. ret <- as.numeric/as.numeric -1

  6. tail(rt)

  7. # 得到直到2018年的指數(shù)。

  8. # 我們隨后將2018年與其他年份進(jìn)行比較

  9. tid<- which(index)


  1. # 每日收益的平均值和SD(2018年除外)


  2. > mean(100*rt[1:pd])

> SD(100*retd[1:tid])

  1. > # 2008年(到目前為止)每日回報(bào)的平均值和SD值


  2. > mean(100*rtd[-c(1:tpd)])

> SD(100*red[-c(1:mid)])

我們可以看到,2018 年每日收益的均值和標(biāo)準(zhǔn)差與其余的均值和標(biāo)準(zhǔn)差略有不同。這是估計(jì)密度的樣子:


Kolmogorov-Smirnov 檢驗(yàn)

?我們可以做的是計(jì)算每個(gè)密度的累積分布函數(shù)

。2018年的那個(gè)和不包括2018年的那個(gè)。說

分布是針對(duì)2018年的,

分布是針對(duì)其他的。我們計(jì)算每個(gè)X的差異

。我們知道這些(絕對(duì))差異的最大值是如何分布的,所以我們可以用這個(gè)最大值作為測試統(tǒng)計(jì)量,如果它在尾部的分布太遠(yuǎn),我們就認(rèn)為這兩個(gè)分布是不同的。從形式上看。

??

?

?介于 0 和 1 之間(通過構(gòu)造,因?yàn)槲覀儨p去兩個(gè)概率并取絕對(duì)值)。?

?是一個(gè)?Brownian bridge. (最大)差異具有已知分布。這是一個(gè)極限分布,所以我們需要大量的觀測值 n 才能對(duì)這個(gè)檢驗(yàn)有信心。

Kolmogorov-Smirnov 測試 - R 代碼

讓我們將 2018 年的每日收益與其余收益進(jìn)行比較,看看基于 Kolmogorov-Smirnov 檢驗(yàn)的分布是否相同:

  1. # Kolmogorov-Smirnov測試 ####

  2. ks.test


我們看到,最大值是0.067,根據(jù)極限分布,P值是0.3891。所以沒有證據(jù)表明2018年的分布與其他的分布有任何不同。

讓我們來看看置換檢驗(yàn)。主要原因是,鑒于Kolmogorov-Smirnov 檢驗(yàn)是基于極限分布的,為了使其有效,我們需要大量的觀察結(jié)果。但是現(xiàn)在我們不必像過去那樣依賴漸進(jìn)法,因?yàn)槲覀兛梢允褂糜?jì)算機(jī)。

兩個(gè)密度相等的置換檢驗(yàn)Permutation Test

直觀地說,如果密度完全相同,我們可以把它們放在一起,從 "捆綁數(shù)據(jù) "中取樣。在我們的例子中,因?yàn)槲覀儼咽找媛示奂谝粋€(gè)向量中,對(duì)向量進(jìn)行排列意味著2018年的每日收益率現(xiàn)在分散在向量中,所以像上面的方程那樣取一個(gè)差值,就像從一個(gè)無效假設(shè)中進(jìn)行模擬:2018年每日收益率的分布與其他的完全相同?,F(xiàn)在,對(duì)于每個(gè)x,我們將有一個(gè)在原假設(shè)下的差異。我們也有每個(gè)x的實(shí)際差異,來自我們的觀察數(shù)據(jù)。我們現(xiàn)在可以將密度之間的實(shí)際差異(每個(gè)x)平方(或取絕對(duì)值),并將其與我們從 "數(shù)據(jù) "生成的模擬結(jié)果進(jìn)行比較。通過觀察實(shí)際差異落在模擬差異的哪個(gè)四分位數(shù),可以估計(jì)出p值。如果實(shí)際數(shù)據(jù)遠(yuǎn)遠(yuǎn)超出了原假設(shè)下的分布范圍,那么我們將拒絕分布相同的假設(shè)。

密度比較置換檢驗(yàn) - R 代碼

我們來執(zhí)行剛剛描述的操作。兩個(gè)參數(shù)?boot?和grid?是您想要的模擬數(shù)量以及您在計(jì)算 x 時(shí)想要使用的網(wǎng)格點(diǎn)數(shù)?

F(x)

. 因此?ngrid=100?。


  1. # 我們需要兩組的索引,2018年和其他的。

  2. id <- substr

  3. tmnd <- i1 == 2018

  4. sme

我們可以看到 p 值與我們使用 Kolmogorov-Smirnov 檢驗(yàn)得到的值差別不大。這是它的樣子:

等密度檢驗(yàn):p 值 = 0.326

最受歡迎的見解

1.Matlab馬爾可夫鏈蒙特卡羅法(MCMC)估計(jì)隨機(jī)波動(dòng)率(SV,Stochastic Volatility) 模型

2.基于R語言的疾病制圖中自適應(yīng)核密度估計(jì)的閾值選擇方法

3.WinBUGS對(duì)多元隨機(jī)波動(dòng)率模型:貝葉斯估計(jì)與模型比較

4.R語言回歸中的hosmer-lemeshow擬合優(yōu)度檢驗(yàn)

5.matlab實(shí)現(xiàn)MCMC的馬爾可夫切換ARMA – GARCH模型估計(jì)

6.R語言區(qū)間數(shù)據(jù)回歸分析

7.R語言WALD檢驗(yàn) VS 似然比檢驗(yàn)

8.python用線性回歸預(yù)測股票價(jià)格

9.R語言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)


拓端tecdat|R語言股票收益分布一致性檢驗(yàn)KS檢驗(yàn)Kolmogorov-Smirnov、置換檢驗(yàn)Permuta的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
桐梓县| 吴堡县| 汾阳市| 内黄县| 怀来县| 二连浩特市| 应用必备| 贡山| 临洮县| 宜宾县| 柘荣县| 鸡东县| 宜兴市| 江阴市| 永胜县| 漳州市| 天峻县| 南通市| 滦平县| 镇巴县| 岗巴县| 大名县| 天台县| 达州市| 湾仔区| 历史| 宁河县| 马关县| 安吉县| 黔西| 新民市| 林芝县| 望城县| 达孜县| 益阳市| 荃湾区| 高安市| 平乡县| 峡江县| 清徐县| SHOW|