R語言小數(shù)定律的保險(xiǎn)業(yè)應(yīng)用:泊松分布模擬索賠次數(shù)
原文鏈接:http://tecdat.cn/?p=14080
?
?
在保險(xiǎn)業(yè)中,由于分散投資,通常會(huì)在合法的大型投資組合中提及大數(shù)定律。在一定時(shí)期內(nèi),損失“可預(yù)測”。當(dāng)然,在標(biāo)準(zhǔn)的統(tǒng)計(jì)假設(shè)下,即有限的期望值和獨(dú)立性。由于在保險(xiǎn)業(yè)中,災(zāi)難通常很少發(fā)生,而且代價(jià)非常高昂,精算師可能有興趣對少量事件的發(fā)生進(jìn)行建模。背后的定理有時(shí)也被稱為小數(shù)定律。
?
泊松分布
所謂的泊松分布(請參閱http://en.wikipedia.org/…)由SiméonPoisson于1837年進(jìn)行了介紹。亞伯拉罕·德·莫伊夫(Abraham De Moivre)于1711年在De Mensura Sortis seu對其進(jìn)行了定義。
讓??
表示一個(gè)計(jì)數(shù)隨機(jī)變量,然后它是服從泊松分布,如果有??
這樣
De Moivre從二項(xiàng)式分布的近似值獲得了該分布?;叵胍幌拢?xiàng)式分布是精算科學(xué)中的標(biāo)準(zhǔn)分布,例如,用來模擬
被保險(xiǎn)人死亡人數(shù)??。如果單個(gè)死亡概率相同,例如
,并且如果死亡是獨(dú)立事件,則
而如果??
和??
,然后
再次,這是一個(gè)漸近定理,當(dāng)我們有很多觀察值時(shí)(
)成立,它也成立,而且出現(xiàn)的可能性應(yīng)該非常小(因?yàn)?/p>
),這就是為什么要使用術(shù)語“?小數(shù)”的原因。SiméonPoisson對數(shù)學(xué)近似值不感興趣:他的主要觀點(diǎn)是針對他正在處理的數(shù)據(jù)獲得具有良好擬合優(yōu)度的分布。
小數(shù)定律
與Poisson分布有關(guān)的主要定理的啟發(fā)式如下:??
表示iid隨機(jī)變量采用值
(一般情況下,一個(gè)分量可以是時(shí)間,另一分量可以是感興趣的上部區(qū)域,其中某些隨機(jī)過程是可能)。讓
。如果??
作為假設(shè)
(或
更具體地假設(shè)),則??
表示事件的(隨機(jī)變量表征)計(jì)數(shù)
,則??
可以通過帶有參數(shù)的泊松分布來近似
。
啟發(fā)式方法是,如果考慮大量觀察值,并且計(jì)算給定(?。﹨^(qū)域中有多少觀察值,則此類觀察值的數(shù)量就是泊松分布。
n=1000
polygon(c(u,rev(u)),c(v,rev(-v)),col="yellow",border=NA)
I=(X^2+Y^2)<1
points(X[I],Y[I],cex=.6,pch=19,col="red")
?
如果我們進(jìn)行一些模擬
> ?n=1000
> ?ns=100000
> ?N=rep(NA,ns)
>
+
+
+
+
+
>
> mean(N)
[1] 31.41257
?
泊松分布的參數(shù)是黃色圓盤的面積,即正方形的面積,即
> lines(0:60-.5,dpois(0:60,lambda),type="b",col="red")
?
為了獲得與保險(xiǎn)模型有關(guān)的解釋,讓我們??
在再保險(xiǎn)合同中表示上層,即
某些可扣除額
。讓我們??
來表示個(gè)人損失。然后,可以使用泊松分布對到達(dá)該上層的索賠的數(shù)量進(jìn)行建模。更準(zhǔn)確地說,如果自付額??
變得非常大(和
),我們將獲得極值理論中的閾值點(diǎn)以上模型:如果??
有一個(gè)泊松分布,并在有條件的
,??
是獨(dú)立同分布的廣義帕累托隨機(jī)變量,然后?
具有廣義的極值分布。因此,超出模型(針對罕見事件)與泊松過程密切相關(guān)。
泊松過程
如上所述,當(dāng)事件以某種方式隨機(jī)且獨(dú)立地隨時(shí)間發(fā)生時(shí),就會(huì)出現(xiàn)泊松分布。然后很自然地研究兩次事件之間的時(shí)間(或在保險(xiǎn)范圍內(nèi)兩次索賠)。
泊松分布和索賠發(fā)生
既不是SiméonPoisson也不是De Moivre,而是Ladislaus Von Bortkiewicz首先提到了Poisson分布是小數(shù)定律。1898年,他研究了1875年至1894年間被馬踢倒殺死的士兵的人數(shù),其中有200個(gè)兵團(tuán)。
他確實(shí)獲得了以下分布(此處,泊松分布的參數(shù)為0.61,即每年的平均死亡人數(shù))
?
在很多情況下,泊松分布都非常適合。例如,如果我們考慮1850年后在佛羅里達(dá)州的颶風(fēng)數(shù)量,
泊松分布和回歸期
返回期是由Emil Gumbel在水文學(xué)中介紹的,用于鏈接概率和持續(xù)時(shí)間。十年事件的發(fā)生概率為1/10。那么10是發(fā)生之前的平均等待時(shí)間。這并不意味著該事件不會(huì)在10年之前發(fā)生,或者必須在10年之前發(fā)生??紤]一個(gè)返回期??
(以年為單位),則每年不出現(xiàn)的概率為
。
則
多年未發(fā)生的概率為??
。通常用下表來總結(jié)此屬性,
上表中的對角線非常有趣。似乎在某種程度上趨向極限值(此處為63.2%)。在n年內(nèi)觀察到的事件數(shù)量具有二項(xiàng)式分布,其概率為
,將收斂到參數(shù)為1的泊松分布。那么
,沒有災(zāi)難的概率為,等于0.632。
稀有概率與泊松分布
計(jì)算稀有事件的概率時(shí),泊松分布不斷出現(xiàn)。例如,在50年的時(shí)間里,至少有一次在核電廠發(fā)生事故的可能性。假設(shè)在反應(yīng)堆中發(fā)生事故的年概率??
很小,例如0.05%。進(jìn)一步假設(shè)反應(yīng)堆在時(shí)間上相互獨(dú)立。在50年內(nèi)發(fā)生超過80個(gè)反應(yīng)堆的事件的概率是
當(dāng)然,線性近似是不正確的
另一方面
>
>
[1] 0.1812733
>
[1] 0.1812692
?
這是具有參數(shù)為的泊松分布
時(shí)為零??的概率??。我們在這里清楚地看到近似在風(fēng)險(xiǎn)管理中的應(yīng)用。
解決這個(gè)問題的另一種方法是基于以下思想:鑒于在對全球450座反應(yīng)堆進(jìn)行的45年觀察中(,觀察到了三起重大事故,包括“三哩島”(1979年)和“福島”(2011年),即兩次事故之間的平均時(shí)間估計(jì)為16年。對于單個(gè)反應(yīng)堆,我們可以假設(shè)事件發(fā)生之前等待的平均時(shí)間是16年的450倍,即7200年?;蛘撸粋€(gè)反應(yīng)堆在一年內(nèi)發(fā)生一次事件的概率是7200以上的事件之一(這是“返還期”概念背后的想法)。如果我們假設(shè)事故的到來是隨機(jī)且彼此獨(dú)立發(fā)生的(如上定義),則在50年內(nèi)觀察到的重大事故數(shù)量遵循參數(shù)為50 /(7200/80)的泊松分布。也,
即
>
[1] 0.4262466
?
參考文獻(xiàn)
1.R語言泊松Poisson回歸模型分析案例
2.R語言進(jìn)行數(shù)值模擬:模擬泊松回歸模型
3.r語言泊松回歸分析
4.R語言對布豐投針(蒲豐投針)實(shí)驗(yàn)進(jìn)行模擬和動(dòng)態(tài)可視化
5.用R語言模擬混合制排隊(duì)隨機(jī)服務(wù)排隊(duì)系統(tǒng)
6.GARCH(1,1),MA以及歷史模擬法的VaR比較
7.R語言做復(fù)雜金融產(chǎn)品的幾何布朗運(yùn)動(dòng)的模擬
8.R語言進(jìn)行數(shù)值模擬:模擬泊松回歸模型
9.R語言對巨災(zāi)風(fēng)險(xiǎn)下的再保險(xiǎn)合同定價(jià)研究案例:廣義線性模型和帕累托分布Pareto distributions
?