R語言極值理論:希爾HILL統(tǒng)計量尾部指數(shù)參數(shù)估計可視化
原文鏈接:http://tecdat.cn/?p=26277?
原文出處:拓端數(shù)據(jù)部落公眾號
極值理論對樣本尾部分布的極值指數(shù)的估計方法主要有兩類:半?yún)?shù)方法和全 參數(shù)方法,前者主要是基于分布尾部的 Hill 估計量,后者則主要基于廣義帕累托分布。
尾部指數(shù)的希爾HILL統(tǒng)計量估計。更具體地說,我們看到如果?

, 和?

,然后希爾HILL估計為?

?

?

。 然后?

?在某種意義上滿足某種一致性?

?,如果?

,即?

?(在收斂速度的附加假設(shè)下,?

)。此外,在附加的技術(shù)條件下

為了說明這一點,請考慮以下代碼。首先,讓我們考慮一個帕累托生存函數(shù),以及相關(guān)的分位數(shù)函數(shù)
> Q=fuction(p){unro(funion(x) S(x)-(1-p),loer=1,per=1e+9)$root}
我們將考慮更復(fù)雜的生存函數(shù)。這是生存函數(shù)和分位數(shù)函數(shù),
> plot(u,Veie(Q)(u),type="l")


在這里,我們需要 分位數(shù)函數(shù)從這個分布中生成一個隨機樣本,
> X=Vectorize(Q)(runif(n))
hill統(tǒng)計量在這里
> abline(h=alpha)

我們現(xiàn)在可以生成數(shù)千個隨機樣本,并查看這些估計器(對于某些特定的?

的)。
> for(s in 1:ns){
+ X=Vectorize
+ H=hill
+ hilk=function(k)
+ HilK[s,]=Vectorize
+ }

如果我們計算平均值,
> plot(15*(1:10),apply(2,mean)

我們得到了一系列可以被認(rèn)為是無偏的估計量。
現(xiàn)在,回想一下,處于 Fréchet 分布并不意味著?

, 和?

, 但意味著

對于一些緩慢變化的函數(shù)?
,不一定恒定!為了了解可能發(fā)生的情況,我們必須稍微具體一些。這只能通過查看生存函數(shù)的性質(zhì)。假設(shè),這里有一些輔助函數(shù)?
?
這個(正)常數(shù)?
?以某種方式與生存函數(shù)與冪函數(shù)之比的收斂速度有關(guān)。
更具體地說,假設(shè)
然后,使用獲得二階正則變化性質(zhì)?
,然后,如果?
?趨向于無窮大太快,那么估計就會有偏差。?如果?
,那么,對于一些?
,
這個結(jié)果的直觀解釋是,如果?
?太大,并且如果基礎(chǔ)分布不完全?是帕累托分布,那么希爾估計量是有偏的。這就是我們所說的意思
如果?
?太大,?
?是有偏估計量
如果?

?太小,?

?是一個不穩(wěn)定的估計量
(后者來自樣本均值的屬性:觀察越多,均值的波動性越?。?/p>
讓我們運行一些模擬以更好地了解正在發(fā)生的事情。使用前面的代碼,生成具有生存函數(shù)的隨機樣本實際上是極其簡單的

> Q=function(p){uniroot(function(x) S(x)-(1-p)}
如果我們使用上面的代碼。
希爾hill變成
> abline(h=alpha)

但它僅基于一個樣本。再次考慮數(shù)千個樣本,讓我們看看 Hill 統(tǒng)計量如何,

所以這些估計量的(經(jīng)驗)平均值是


最受歡迎的見解
1.R語言POT超閾值模型和極值理論分析
2.R語言極值理論EVT:基于GPD模型的火災(zāi)損失分布分析
3.R語言有極值(EVT)依賴結(jié)構(gòu)的馬爾可夫鏈(MC)對洪水極值分析
4.R語言回歸中的hosmer-lemeshow擬合優(yōu)度檢驗
5.matlab實現(xiàn)MCMC的馬爾可夫切換ARMA – GARCH模型估計
6.R語言區(qū)間數(shù)據(jù)回歸分析
7.R語言WALD檢驗 VS 似然比檢驗
8.python用線性回歸預(yù)測股票價格
9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標(biāo)