拓端tecdat|R語言極值推斷:廣義帕累托分布GPD使用極大似然估計(jì)、輪廓似然估計(jì)、Delt
原文鏈接:http://tecdat.cn/?p=22566?
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
本文是極端值推斷的內(nèi)容。我們?cè)趶V義帕累托分布上使用最大似然方法。
極大似然估計(jì)
在參數(shù)模型的背景下,標(biāo)準(zhǔn)技術(shù)是考慮似然的最大值(或?qū)?shù)似然)??紤]到一些技術(shù)性假設(shè),如?
?,
的某個(gè)鄰域,那么
其中
表示費(fèi)雪信息矩陣。在此考慮一些樣本,來自廣義帕累托分布,參數(shù)為
?,因此?
如果我們解決極大似然的一階條件,我們得到一個(gè)滿足以下條件的估計(jì)
這種漸進(jìn)正態(tài)性的概念如下:如果樣本的真實(shí)分布是一個(gè)具有參數(shù)
的GPD,那么,如果n足夠大,就會(huì)有一個(gè)聯(lián)合正態(tài)分布
。因此,如果我們產(chǎn)生大量的樣本(足夠大,例如200個(gè)觀測(cè)值),那么估計(jì)的散點(diǎn)圖應(yīng)該與高斯分布的散點(diǎn)圖相同。
> for(s in 1:1000){
+ param[s,]=gpd(x,0)$par.ests
> image(x,y,z)
得到一個(gè)3D的表示
> persp(x,y,t(z)
+ xlab="xi",ylab="sigma")
有了200個(gè)觀測(cè)值,如果真正的基礎(chǔ)分布是GPD,那么,聯(lián)合分布
是正態(tài)的。
?
Delta德爾塔法
另一個(gè)重要的屬性是德爾塔法。這個(gè)想法是,如果是漸進(jìn)正態(tài),足夠平滑,那么也是漸進(jìn)高斯的。
從這個(gè)屬性中,我們可以得到
(這是極值模型中使用的另一個(gè)參數(shù)化)的正態(tài)性,或者在任何四分位數(shù)
上 。我們運(yùn)行一些模擬,再一次檢查聯(lián)合正態(tài)性。
> for(s in 1:1000)
+ gpd(x,0)$par.ests
+ q=sha * (.01^(-xih) - 1)/xih
+ tvar=q+(sha + xih * q)/(1 - xih)
dmnorm(cbind(vx,vy),m,S)
> image(x,y,t(z)
正如我們所看到的,在樣本大小為200的情況下,我們不能使用這個(gè)漸進(jìn)式的結(jié)果:看起來我們沒有足夠的數(shù)據(jù)。但是,如果我們?cè)趎=5000運(yùn)行同樣的代碼,
?
> n=5000
我們得到
和
的聯(lián)合正態(tài)性。這就是我們可以從這個(gè)結(jié)果中得到的delta-方法。
?
輪廓似然( Profile Likelihood )
另一個(gè)有趣的方法是Profile?似然函數(shù)的概念。因?yàn)槲膊恐笖?shù)
,
在這里是輔助參數(shù)。
這可以用來推導(dǎo)出置信區(qū)間。在GPD的情況下,對(duì)于每個(gè)
?,我們必須找到一個(gè)最優(yōu)的 。我們計(jì)算Profile?似然函數(shù),即
?。而我們可以計(jì)算出這個(gè)輪廓似然的最大值。一般來說,這個(gè)兩階段的優(yōu)化與(全局)最大似然是不等價(jià)的,計(jì)算結(jié)果如下
+ ?profilelikelihood=function(beta){
+ ?-loglik(XI,beta) }
+ ?L[i]=-optim(par=1,fn=profilelik)$value }
如果我們想計(jì)算輪廓似然的最大值(而不是像以前那樣只計(jì)算網(wǎng)格上的輪廓似然的值),我們使用
+ ?profile=function(beta){
+ ?-loglikelihood(XI,beta) }
(OPT=optimize(f=PL,interval=c(0,3)))
我們得到結(jié)果和最大似然估計(jì)的
相似。我們可以用這種方法來計(jì)算置信區(qū)間,在圖表上將其可視化
> line(h=-up-qchisq(p=.95,df=1)
> ?I=which(L>=-up-qchisq(p=.95,df=1))
> ?lines(XIV[I]
豎線是參數(shù)
95%置信區(qū)間的下限和上限。
最受歡迎的見解
1.R語言POT超閾值模型和極值理論分析
2.R語言極值理論EVT:基于GPD模型的火災(zāi)損失分布分析
3.R語言有極值(EVT)依賴結(jié)構(gòu)的馬爾可夫鏈(MC)對(duì)洪水極值分析
4.R語言回歸中的hosmer-lemeshow擬合優(yōu)度檢驗(yàn)
5.matlab實(shí)現(xiàn)MCMC的馬爾可夫切換ARMA – GARCH模型估計(jì)
6.R語言區(qū)間數(shù)據(jù)回歸分析
7.R語言WALD檢驗(yàn) VS 似然比檢驗(yàn)
8.python用線性回歸預(yù)測(cè)股票價(jià)格
9.R語言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)