R語言預(yù)測人口死亡率:用李·卡特(Lee-Carter)模型、非線性模型進(jìn)行平滑估計(jì)|附代碼
全文鏈接:http://tecdat.cn/?p=13663
最近我們被客戶要求撰寫關(guān)于預(yù)測人口死亡率的研究報(bào)告,包括一些圖形和統(tǒng)計(jì)輸出。
今天早上,我和同事一起分析死亡率。我們在研究人口數(shù)據(jù)集,可以觀察到很多波動(dòng)性
我們得到這樣的結(jié)果:
?

?
由于我們?nèi)鄙僖恍?shù)據(jù),因此我們想使用一些廣義非線性模型。因此,讓我們看看如何獲得死亡率曲面圖的平滑估計(jì)。我們編寫一些代碼。
D=DEATH$MaleE=EXPO$MaleA=as.numeric(as.character(DEATH$Age))Y=DEATH$YearI=(A<100)base=data.frame(D=D,E=E,Y=Y,A=A)subbase=base[I,]subbase=subbase[!is.na(subbase$A),]
第一個(gè)想法可以是使用Poisson模型,其中死亡率是年齡和年份的平穩(wěn)函數(shù),類似于

可以使用
persp(vZ,theta=-30,col="green",shade=TRUE,xlab="Ages (0-100)",ylab="Years (1900-2005)",zlab="Mortality rate (log)")
死亡率曲面圖

?
點(diǎn)擊標(biāo)題查閱往期內(nèi)容

R語言Lee-Carter模型對年死亡率建模預(yù)測預(yù)期壽命

左右滑動(dòng)查看更多

01

02

03

04

還可以提取年份的平均值,這是

?Lee-Carter模型中系數(shù)的解釋??
predAx=function(a) mean(predict(regbsp,newdata=data.frame(A=a,Y=seq(min(subbase$Y),max(subbase$Y)),E=1)))plot(seq(0,99),Vectorize(predAx)(seq(0,99)),col="red",lwd=3,type="l")
我們有以下平滑的死亡率

?
回顧下李·卡特模型是

可以使用以下方法獲得參數(shù)估計(jì)值
persp(vZ,theta=-30,col="green",shade=TRUE,xlab="Ages (0-100)",ylab="Years (1900-2005)",zlab="Mortality rate (log)")
粗略的死亡率曲面圖是

?
有以下??

?系數(shù)。
plot(seq(1,99),coefficients(regnp)[2:100],col="red",lwd=3,type="l")

?
這里我們有很多系數(shù),但是,在較小的數(shù)據(jù)集上,我們具有更多的可變性。我們可以平滑李·卡特模型:?

?代碼片段
persp(vZ,theta=-30,col="green",shade=TRUE,xlab="Ages (0-100)", ylab="Years (1900-2005)",zlab="Mortality rate (log)")
現(xiàn)在的死亡人數(shù)是

?
得出多年來隨年齡變化的平均死亡率,
BpA=bs(seq(0,99),knots=knotsA,Boundary.knots=range(subbase$A),degre=3)Ax=BpA%*%coefficients(regsp)[2:8]plot(seq(0,99),Ax,col="red",lwd=3,type="l")

?
然后,我們可以使用樣條函數(shù)的平滑參數(shù),并查看對死亡率曲面的影響
persp(vZ,theta=-30,col="green",shade=TRUE,xlab="Ages (0-100)",ylab="Years (1900-2005)",zlab="Mortality rate (log)")

點(diǎn)擊文末?“閱讀原文”
獲取全文完整代碼數(shù)據(jù)資料。
本文選自《R語言預(yù)測人口死亡率:用李·卡特(Lee-Carter)模型、非線性模型進(jìn)行平滑估計(jì)》。
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
R語言分布滯后非線性模型(DLNM)研究發(fā)病率,死亡率和空氣污染示例
R語言分布滯后非線性模型(DLNM)空氣污染研究溫度對死亡率影響建模應(yīng)用
R語言分布滯后線性和非線性模型(DLM和DLNM)建模
分布滯后線性和非線性模型(DLNM)分析空氣污染(臭氧)、溫度對死亡率時(shí)間序列數(shù)據(jù)的影響
R語言中的分布滯后非線性模型DLNM與發(fā)病率和空氣污染示例
【視頻】R語言中的分布滯后非線性模型(DLNM)與發(fā)病率,死亡率和空氣污染示例
R語言分布滯后線性和非線性模型(DLNM)分析空氣污染(臭氧)、溫度對死亡率時(shí)間序列數(shù)據(jù)的影響
R語言分布滯后線性和非線性模型(DLMs和DLNMs)分析時(shí)間序列數(shù)據(jù)
R語言分布滯后非線性模型(DLNM)空氣污染研究溫度對死亡率影響建模應(yīng)用R語言分布滯后非線性模型(DLNM)研究發(fā)病率,死亡率和空氣污染示例R語言Lee-Carter模型對年死亡率建模預(yù)測預(yù)期壽命
R語言預(yù)測人口死亡率:用李·卡特(Lee-Carter)模型、非線性模型進(jìn)行平滑估計(jì)
Tableau 數(shù)據(jù)可視化:探索性圖形分析新生兒死亡率數(shù)據(jù)
R語言模擬人類生活預(yù)期壽命動(dòng)態(tài)可視化動(dòng)畫圖gif
r語言繪制動(dòng)態(tài)統(tǒng)計(jì)圖:繪制世界各國的人均GDP,出生時(shí)的預(yù)期壽命和人口氣泡圖動(dòng)畫動(dòng)態(tài)gif圖
R語言非參數(shù)模型厘定保險(xiǎn)費(fèi)率:局部回歸、廣義相加模型GAM、樣條回歸
R語言小數(shù)定律的保險(xiǎn)業(yè)應(yīng)用:泊松分布模擬索賠次數(shù)
R語言對巨災(zāi)風(fēng)險(xiǎn)下的再保險(xiǎn)合同定價(jià)研究案例:廣義線性模型和帕累托分布Pareto distributions分析
R語言中的廣義線性模型(GLM)和廣義相加模型(GAM):多元(平滑)回歸分析保險(xiǎn)資金投資組合信用風(fēng)險(xiǎn)敞口