拓端tecdat|R語(yǔ)言用Copulas模型的尾部相依性分析損失賠償費(fèi)用
原文鏈接:http://tecdat.cn/?p=22226?
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
兩個(gè)隨機(jī)變量之間的相依性問(wèn)題備受關(guān)注,相依性(dependence)是反映兩個(gè)隨機(jī)變量之間關(guān)聯(lián)程度的一個(gè)概念。它與相關(guān)性(correlation)有區(qū)別,常用的相關(guān)性度量是Pearson相關(guān)系數(shù),它只度量了兩個(gè)隨機(jī)變量之間的線性關(guān)系,其值不僅依賴(lài)于它們的Copula函數(shù),而且還依賴(lài)它們的邊緣分布函數(shù)。
直觀地說(shuō),Copula函數(shù)就是兩個(gè)(或多個(gè))隨機(jī)變量的聯(lián)合分布可以表示為它們的邊緣分布函數(shù)的函數(shù),這個(gè)函數(shù)就是Copula函數(shù),它與隨機(jī)變量的邊緣分布沒(méi)有關(guān)系,所反映的是兩個(gè)(多個(gè))隨機(jī)變量之間的“結(jié)構(gòu)”,這種結(jié)構(gòu)包含了兩個(gè)隨機(jī)變量相依性的全部信息。
Joe(1990)尾部相依性指數(shù)
Joe(1990)提出了一個(gè)(強(qiáng))尾部相依性指數(shù)。例如,對(duì)于下尾,可以考慮

也就是

上下尾(經(jīng)驗(yàn))相依性函數(shù)
我們的想法是繪制上面的函數(shù)。定義

下尾

對(duì)上尾來(lái)說(shuō),其中是

與?

,相依的生存copula ,即

其中

現(xiàn)在,我們可以很容易地推導(dǎo)出這些函數(shù)的經(jīng)驗(yàn)對(duì)應(yīng)關(guān)系,即:


因此,對(duì)于上尾,在右邊,我們有以下圖形

而對(duì)于下尾,在左邊,我們有

損失賠償數(shù)據(jù)?
Copula函數(shù)在經(jīng)濟(jì)、金融、保險(xiǎn)等領(lǐng)域有廣泛的應(yīng)用.早在1998年Frees和Valdez(1998)研究了索賠額與管理費(fèi)之間的關(guān)系,采用了Copula函數(shù)對(duì)其進(jìn)行刻畫(huà)并應(yīng)用于保費(fèi)的定價(jià)。
對(duì)于代碼,考慮一些真實(shí)的數(shù)據(jù),比如損失賠償數(shù)據(jù)集。
損失賠償費(fèi)用數(shù)據(jù)有1,500個(gè)樣本和2個(gè)變量。這兩欄包含賠償金付款(損失)和分配的損失調(diào)整費(fèi)用(alae)。后者是與解決索賠相關(guān)的額外費(fèi)用(如索賠調(diào)查費(fèi)用和法律費(fèi)用)。

我們的想法是,在左邊繪制下尾函數(shù),在右邊繪制上尾函數(shù)。

現(xiàn)在,我們可以將這個(gè)圖形,與一些具有相同Kendall's tau參數(shù)的copulas圖形進(jìn)行比較
高斯copulas
如果我們考慮高斯copulas 。?
> copgauss=normalCopula(paramgauss)
> Lga=function(z) pCopula(c(z,z),copgauss)/z
> Rga=function(z) (1-2*z+pCopula(c(z,z),copgauss))/(1-z)
> lines(c(u,u+.5-u[1]),c(Lgs,Rgs)

Gumbel?copula
或Gumbel的copula。
> copgumbel=gumbelCopula(paramgumbel, dim = 2)
> lines(c(u,u+.5-u[1])

置信區(qū)間
但是由于我們沒(méi)有任何置信區(qū)間,所以仍然很難得出結(jié)論(即使看起來(lái)Gumbel copula比Gaussian copula更適合)。一個(gè)策略可以是從這些copula曲線中生成樣本,并可視化。對(duì)于高斯copula曲線
> nsimul=500
> for(s in 1:nsimul){
+ Xs=rCopula(nrow(X),copgauss)
+ Us=rank(Xs[,1])/(nrow(Xs)+1)
+ Vs=rank(Xs[,2])/(nrow(Xs)+1)
+ lines(c(u,u+.5-u[1]),MGS[s,],col="red")
包括–逐點(diǎn)–90%的置信區(qū)間
> Q95=function(x) quantile(x,.95)
> lines(c(u,u+.5-u[1]),V05,col="red",lwd=2)
高斯copula曲線??

Gumbel copula曲線?

盡管統(tǒng)計(jì)收斂的速度會(huì)很慢,評(píng)估底層的copula 曲線是否具有尾部相依性簡(jiǎn)單。尤其是當(dāng)copula 曲線表現(xiàn)出尾部獨(dú)立性的時(shí)候。比如考慮一個(gè)1000大小的高斯copula 樣本。這是我們生成隨機(jī)方案后得到的結(jié)果。

或者我們看一下左邊的尾巴(用對(duì)數(shù)比例)

現(xiàn)在,考慮10000個(gè)樣本。
在這些圖上,如果極限是0,或者是某個(gè)嚴(yán)格的正值,是相當(dāng)難以斷定的(同樣,當(dāng)感興趣的值處于參數(shù)的支持邊界時(shí),這是一個(gè)經(jīng)典的統(tǒng)計(jì)問(wèn)題)。所以,一個(gè)簡(jiǎn)單的想法是考慮一個(gè)較弱的尾部相依指數(shù)。
Ledford?和Tawn(1996)尾部相關(guān)系數(shù)
描述尾部相依性的另一種方法可以在Ledford & Tawn(1996)中找到。假設(shè)和具有相同的分布?,F(xiàn)在,如果我們假設(shè)這些變量是(嚴(yán)格)獨(dú)立的。
但如果我們假設(shè)這些變量是(嚴(yán)格的)同單調(diào)性的(即這里的變量是相等的,因?yàn)樗鼈冇邢嗤姆植迹?,則
所以,有這樣一個(gè)假設(shè):
那么a=2可以解釋為獨(dú)立性,而a=1則表示強(qiáng)(完美)正相依性。因此,考慮進(jìn)行如下變換,得到[0,1]中的一個(gè)參數(shù),其相依性強(qiáng)度隨指數(shù)的增加而增加,例如
為了推導(dǎo)出尾部相依指數(shù),假設(shè)存在一個(gè)極限,即
這將被解釋為一個(gè)(弱)尾部相依指數(shù)。因此定義函數(shù)
下尾巴(在左邊)
上尾(在右邊)。計(jì)算這些函數(shù)的R代碼非常簡(jiǎn)單。
> L2emp=function(z) 2*log(mean(U<=z))/
> R2emp=function(z) 2*log(mean(U>=1-z))/
+ log(mean((U>=1-z)&(V>=1-z)))-1
> plot(c(u,u+.5-u[1]),c(L,R),type="l",ylim=0:1,
> abline(v=.5,col="grey")
?高斯copula函數(shù)
同樣,也可以將這些經(jīng)驗(yàn)函數(shù)與一些參數(shù)函數(shù)進(jìn)行對(duì)比,例如,從高斯copula函數(shù)中得到的函數(shù)(具有相同的Kendall's tau)。
> copgauss=normalCopula(paramgauss)
> Lgs =function(z) 2*log(z)/log(pCopula(c(z,z),
+ copgauss))-1
> Rgas =function(z) 2*log(1-z)/log(1-2*z+
+ pCopula(c(z,z),copgauss))-1
> lines(c(u,u+.5-u[1])
Gumbel copula
> copgumbel=gumbelCopula(paramgumbel, dim = 2)
> L=function(z) 2*log(z)/log(pCopula(c(z,z),
+ copgumbel))-1
> R=function(z) 2*log(1-z)/log(1-2*z+
+ pCopula(c(z,z),copgumbel))-1
> lines(c(u,u+.5-u[1]),c(Lgl,Rgl),col="blue")
同樣,我們觀察置信區(qū)間,Gumbel copula在這里提供了一個(gè)很好的擬合
極值copula
我們考慮copulas族中的極值copulas。在雙變量的情況下,極值可以寫(xiě)為?
其中
為Pickands相依函數(shù),它是一個(gè)凸函數(shù),滿足于

觀察到,在這種情況下:

其中
肯德?tīng)栂禂?shù),可寫(xiě)成

例如

那么,我們就得到了Gumbel copula。 現(xiàn)在,我們來(lái)看(非參數(shù))推理,更準(zhǔn)確地說(shuō),是相依函數(shù)的估計(jì)。最標(biāo)準(zhǔn)的估計(jì)器的出發(fā)點(diǎn)是觀察
是否有copula函數(shù)?

具有分布函數(shù)

而反過(guò)來(lái),Pickands相依函數(shù)可以寫(xiě)成

因此,Pickands函數(shù)的自然估計(jì)是

其中,
是經(jīng)驗(yàn)累積分布函數(shù)

這是Capéràa, Fougères & Genest (1997)中提出的估計(jì)方法。在這里,我們可以用
> Z=log(U[,1])/log(U[,1]*U[,2])
> h=function(t) mean(Z<=t)
> a=function(t){
function(t) (H(t)-t)/(t*(1-t))
+ return(exp(integrate(f,lower=0,upper=t,
+ subdivisions=10000)$value))
> plot(c(0,u,1),c(1,A(u),1),type="l"
整合得到Pickands相依函數(shù)的估計(jì)值。上圖中可以直觀地看到上尾的相依指數(shù)。

> A(.5)/2
[1] 0.4055346

最受歡迎的見(jiàn)解
1.R語(yǔ)言基于ARMA-GARCH-VaR模型擬合和預(yù)測(cè)實(shí)證研究
2.r語(yǔ)言實(shí)現(xiàn)copula算法建模依賴(lài)性案例
3.R語(yǔ)言COPULAS和金融時(shí)間序列數(shù)據(jù)VaR分析
4.R語(yǔ)言多元COPULA GARCH 模型時(shí)間序列預(yù)測(cè)
5.GARCH(1,1),MA以及歷史模擬法的VaR比較
6.matlab使用Copula仿真優(yōu)化市場(chǎng)風(fēng)險(xiǎn)數(shù)據(jù)分析
7.R語(yǔ)言實(shí)現(xiàn)向量自動(dòng)回歸VAR模型
8.R語(yǔ)言隨機(jī)搜索變量選擇SSVS估計(jì)貝葉斯向量自回歸(BVAR)模型
9.R語(yǔ)言VAR模型的不同類(lèi)型的脈沖響應(yīng)分析