最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

拓端tecdat|R語(yǔ)言分布滯后線性和非線性模型(DLNM)分析空氣污染(臭氧)、溫度對(duì)死亡

2021-10-17 11:21 作者:拓端tecdat  | 我要投稿

原文鏈接?http://tecdat.cn/?p=23947?

原文出處:拓端數(shù)據(jù)部落公眾號(hào)

摘要

分布滯后非線性模型(DLNM)表示一個(gè)建模框架,可以靈活地描述在時(shí)間序列數(shù)據(jù)中顯示潛在非線性和滯后影響的關(guān)聯(lián)。該方法論基于交叉基的定義,交叉基是由兩組基礎(chǔ)函數(shù)的組合表示的二維函數(shù)空間,它們分別指定了預(yù)測(cè)變量和滯后變量的關(guān)系。本文在R軟件實(shí)現(xiàn)DLNM,然后幫助解釋結(jié)果,并著重于圖形表示。本文提供指定和解釋DLNM的概念和實(shí)踐步驟,并舉例說(shuō)明了對(duì)實(shí)際數(shù)據(jù)的應(yīng)用。

關(guān)鍵字:分布滯后模型,時(shí)間序列,平滑,滯后效應(yīng),R。

1.簡(jiǎn)介

統(tǒng)計(jì)回歸模型的主要目的是定義一組預(yù)測(cè)變量與結(jié)果之間的關(guān)系,然后估計(jì)相關(guān)影響。當(dāng)依賴項(xiàng)顯示某些滯后影響時(shí),會(huì)進(jìn)一步增加復(fù)雜性:在這種情況下,預(yù)測(cè)變量的發(fā)生(我們稱其為暴露事件)會(huì)在遠(yuǎn)遠(yuǎn)超出事件周期的時(shí)間范圍內(nèi)影響結(jié)果。此步驟需要定義更復(fù)雜的模型以表征關(guān)聯(lián),并指定依賴項(xiàng)的時(shí)間結(jié)構(gòu)。

1.1 概念框架

對(duì)滯后效應(yīng)的適當(dāng)統(tǒng)計(jì)模型的說(shuō)明及其結(jié)果的解釋,有助于建立適當(dāng)?shù)母拍羁蚣堋_@個(gè)框架的主要特點(diǎn)是定義了一個(gè)額外的維度來(lái)描述關(guān)聯(lián),它指定了暴露和結(jié)果之間在滯后維度上的時(shí)間依賴性。這個(gè)術(shù)語(yǔ),借用了時(shí)間序列分析的文獻(xiàn),代表了評(píng)估影響滯后時(shí)暴露事件和結(jié)果之間的時(shí)間間隔。在長(zhǎng)時(shí)間暴露的情況下,數(shù)據(jù)可以通過(guò)等距時(shí)間段的劃分來(lái)構(gòu)造,定義一系列暴露事件和結(jié)果實(shí)現(xiàn)。這種劃分也定義了滯后單位。在這個(gè)時(shí)間結(jié)構(gòu)中,暴露-反應(yīng)關(guān)系可以用兩種相反的觀點(diǎn)中的任何一種來(lái)描述:我們可以說(shuō)一個(gè)特定的暴露事件對(duì)未來(lái)的多個(gè)結(jié)果產(chǎn)生影響,或者說(shuō)一個(gè)特定的結(jié)果可以用過(guò)去多個(gè)暴露事件的貢獻(xiàn)來(lái)解釋。然后,可以使用滯后的概念來(lái)描述向前(從固定結(jié)果到未來(lái)結(jié)果)或向后(從固定結(jié)果到過(guò)去的結(jié)果)的關(guān)系。

最終,滯后效應(yīng)統(tǒng)計(jì)模型的主要特征是它們的二維結(jié)構(gòu):該關(guān)系同時(shí)在預(yù)測(cè)變量的通??臻g和滯后的維度上進(jìn)行描述。

1.2 分布滯后模型

最近,在評(píng)估環(huán)境壓力因素的短期影響的研究中已經(jīng)解決了滯后影響的問(wèn)題:一些時(shí)間序列研究報(bào)告說(shuō),暴露于高水平的污染或極端溫度會(huì)在其發(fā)生后的幾天內(nèi)持續(xù)影響健康( Braga等,2001; Goodman等,2004; Samoli等,2009; Zanobetti和Schwartz,2008)。

給定定義的數(shù)據(jù)時(shí)間結(jié)構(gòu)和簡(jiǎn)單的滯后維度定義,時(shí)間序列研究設(shè)計(jì)可提供多種優(yōu)勢(shì)來(lái)處理滯后影響,其中時(shí)間劃分是由等間隔和有序的時(shí)間點(diǎn)直接指定的。在這種情況下,滯后效應(yīng)可以用分布滯后模型(DLM)來(lái)優(yōu)雅地描述,該模型最初是在計(jì)量經(jīng)濟(jì)學(xué)中開(kāi)發(fā)的(Almon 1965),最近在環(huán)境因素研究中用于量化健康效應(yīng)(Schwartz 2000; Zanobetti et al。2000; 2007)。 Muggeo和Hajat,2009年)。通過(guò)這種方法,可以使用多個(gè)參數(shù)來(lái)解釋在不同時(shí)滯下的影響,從而將單個(gè)暴露事件的影響分布在特定的時(shí)間段內(nèi),

1.3 本文目的

統(tǒng)計(jì)環(huán)境R提供了一組用于指定和解釋DLNM結(jié)果的工具。本文的目的是提供該程序包函數(shù)的全面概述,包括函數(shù)的詳細(xì)摘要以及以實(shí)際數(shù)據(jù)為例的示例。該示例涉及1987-2000年期間兩個(gè)環(huán)境因素(空氣污染(臭氧)和溫度)對(duì)死亡率的影響。在本文中,我重新考慮了定義DLNM,預(yù)測(cè)效果并借助圖形函數(shù)解釋結(jié)果的主要概念和實(shí)踐步驟。

2.非線性和滯后效應(yīng)

在本節(jié)中,我介紹了時(shí)間序列模型的基本公式,然后介紹了描述非線性效應(yīng)和滯后效應(yīng)的方法,后者通過(guò)簡(jiǎn)單DLM的模型來(lái)描述。

2.1 基本模型

時(shí)間序列數(shù)據(jù)的模型通??梢员硎緸椋?/p>

其中μt≡E(Yt),Yt是t = 1時(shí)的一系列結(jié)果...,n,假設(shè)來(lái)自指數(shù)族的分布。函數(shù)sj指定變量xj和線性預(yù)測(cè)變量之間的關(guān)系,該變量由參數(shù)向量βj定義。變量uk包含具有由相關(guān)系數(shù)γk指定的線性效應(yīng)的其他預(yù)測(cè)變量

之前描述的數(shù)據(jù)說(shuō)明性示例中,結(jié)果Yt是每日死亡計(jì)數(shù),假定是泊松分布,其中E(Y)= μ,V(Y)= φμ。

臭氧和溫度的非線性和滯后影響通過(guò)函數(shù)sj建模,該函數(shù)定義了預(yù)測(cè)變量和滯后變量?jī)蓚€(gè)維度之間的關(guān)系

2.2 非線性暴露-反應(yīng)關(guān)系

DLNM開(kāi)發(fā)的第一步是定義預(yù)測(cè)變量空間中的關(guān)系。通常,非線性暴露-反應(yīng)依賴性通過(guò)適當(dāng)?shù)暮瘮?shù)s在回歸模型中表示。在完全參數(shù)化的方法中,提出了幾種不同的函數(shù),每個(gè)函數(shù)都具有不同的假設(shè)和靈活性。主要選擇通常依賴于描述光滑曲線的函數(shù),例如多項(xiàng)式或樣條函數(shù)(Braga等,2001; Dominici等,2004)。關(guān)于線性閾值參數(shù)化的使用(Muggeo 2010; Daniels et al。2000); 或通過(guò)虛擬參數(shù)化進(jìn)行簡(jiǎn)單分層。

所有這些函數(shù)都對(duì)原始預(yù)測(cè)變量進(jìn)行了轉(zhuǎn)換,以生成包含在模型中作為線性項(xiàng)的一組轉(zhuǎn)換變量。相關(guān)的基礎(chǔ)函數(shù)包括原始變量x的一組完全已知的轉(zhuǎn)換,這些轉(zhuǎn)換生成一組稱為基礎(chǔ)變量的新變量。代數(shù)表示可以通過(guò)以下方式給出:

定義DLNM的第一步是在函數(shù)mkbasis()中執(zhí)行的,該函數(shù)用于創(chuàng)建基礎(chǔ)矩陣Z。此函數(shù)的目的是提供一種通用的方式來(lái)包含x的非線性效應(yīng)。舉例來(lái)說(shuō),我建立了一個(gè)將所選基函數(shù)應(yīng)用于向量

的基矩陣:

R> mkais(1:5, tpe = "s", df = 4, egree = 2, cenvlue = 3)

結(jié)果是一個(gè)列表對(duì)象,存儲(chǔ)基礎(chǔ)矩陣和定義該矩陣的自變量。在這種情況下,所選基準(zhǔn)是具有4個(gè)自由度的二次樣條,由參數(shù)類型df和度定義。

可以通過(guò)第二個(gè)參數(shù)類型選擇不同類型的基礎(chǔ)。可用的選項(xiàng)是自然三次方或簡(jiǎn)單的B樣條(類型=“ ns”或“ bs”);虛擬變量層;多項(xiàng)式(“ poly”);閾值類型的函數(shù)和簡(jiǎn)單的線性(“ lin”)。參數(shù)df定義了基礎(chǔ)的維數(shù)(基礎(chǔ)的列數(shù),基本上是轉(zhuǎn)換后的變量的數(shù)目)。該值可能取決于參數(shù)“結(jié)點(diǎn)”。如果未定義,則默認(rèn)情況下將結(jié)放置在等距的分位數(shù)上。自變量度數(shù)選擇“ bs”和“ poly”的多項(xiàng)式度數(shù)。

參數(shù)cen和cenvalue用于使連續(xù)函數(shù)(類型“ ns”,“ bs”,“ poly”和“ lin”)的基準(zhǔn)居中,如果未提供cenvalue,則默認(rèn)為原始變量的均值。

2.3滯后效應(yīng)

定義DLNM的第二步是指定函數(shù),以對(duì)附加滯后維度中的關(guān)系進(jìn)行建模,以實(shí)現(xiàn)滯后效果。在這種情況下,給定時(shí)間t的結(jié)果Yt可以用過(guò)去的暴露量xt-L來(lái)解釋。給定最大滯后L時(shí),附加滯后維度可以由n×(L +1)矩陣Q表示,例如:

簡(jiǎn)單的DLM使用描述結(jié)果與滯后風(fēng)險(xiǎn)之間的依賴關(guān)系的函數(shù)來(lái)允許線性關(guān)系的滯后效應(yīng)。

第二步通過(guò)函數(shù)mklagbasis()進(jìn)行,該函數(shù)調(diào)用mkbasis()來(lái)構(gòu)建基礎(chǔ)矩陣C。例如:

R> mkgbais(mxlag =5,type ="strta", kots = c(2, 4))

在此示例中,在通過(guò)第一個(gè)參數(shù)maxlag將最大滯后固定為5之后,滯后向量0:maxlag對(duì)應(yīng)于

,將自動(dòng)創(chuàng)建并應(yīng)用所選函數(shù)。

3.定義DLNM

DLNM規(guī)范的最后一步涉及同時(shí)定義預(yù)測(cè)器和滯后兩個(gè)維度中的關(guān)系。盡管非線性和滯后效應(yīng)的術(shù)語(yǔ)不同,但這兩個(gè)過(guò)程在概念上是相似的:定義表示相關(guān)空間中關(guān)系的基礎(chǔ)。

然后,通過(guò)交叉基的定義來(lái)指定DLNM,交叉基是二維函數(shù)空間,同時(shí)描述了沿預(yù)測(cè)變量范圍及其滯后維度的依存關(guān)系。首先,選擇x的基函數(shù)得出Z,然后為x的每個(gè)基變量創(chuàng)建附加的滯后維度,從而生成一個(gè)

數(shù)組R˙。通過(guò)定義的C,DLNM可以表示為:

選擇交叉基等于如上所述選擇兩組基函數(shù),將其組合以生成交叉基函數(shù)。這是通過(guò)函數(shù)crossbasis()執(zhí)行的,該函數(shù)調(diào)用函數(shù)mkbasis()和mklagbasis()分別生成兩個(gè)基本矩陣Z和C,而不是通過(guò)張量積將它們組合起來(lái)以產(chǎn)生W??梢允褂么撕瘮?shù)指定臭氧和溫度的兩個(gè)交叉基。相關(guān)代碼為:

  1. basi.o3 <- crossbasis(o3 varype= "hthr"

  2. + vnots = 40, laty = "sata", lanot = c(2,6), mag= 10)

  3. bai.te <- crossbasis(tmp varype = "bs",

  4. + vrgre ?3, vad = 6 cevalu = 25 ladf = 5, malag = 30)

在此示例中,臭氧的交叉基包括一個(gè)預(yù)測(cè)空間的閾值函數(shù),線性關(guān)系超過(guò)40.3 μgr / m3,并且虛擬參數(shù)化假設(shè)沿滯后0-1、2-5和6-10的層具有恒定的分布滯后效應(yīng)。相比之下,溫度的選項(xiàng)是:以25攝氏度為中心的6 自由度的立方樣條(默認(rèn)為等距的結(jié)點(diǎn)),以及以5自由度的立方樣條(默認(rèn)為lagtype =“ ns”)(結(jié)為25℃)。默認(rèn)情況下,最多30個(gè)滯后。

如果未設(shè)置中心值,則默認(rèn)的中心點(diǎn)是預(yù)測(cè)變量的平均值(例如,對(duì)于上述溫度的交叉基,溫度為25℃)。該值代表來(lái)自DLNM的預(yù)期效果的參考。參考值的選擇不影響模型的擬合,并且可以根據(jù)解釋問(wèn)題選擇不同的值。

這些選擇可以通過(guò)函數(shù)summary()進(jìn)行檢查。例如:

R> summary(basis.temp)

為了估計(jì)相應(yīng)參數(shù)η,可以在通用回歸函數(shù)的模型公式中包括交叉基矩陣。在該示例中,最終模型還包括一個(gè)自然立方樣條,以模擬季節(jié)性趨勢(shì)和長(zhǎng)期趨勢(shì)分量,代碼是:

  1. odel <- glmdeath ~ bais.temp+ basis.o +ns(tim 7 * 14) ?dw,

  2. + fmily = quasiposson())

4.根據(jù)DLNM進(jìn)行預(yù)測(cè)

如第3節(jié)所示,DLNM的規(guī)范涉及暴露序列的復(fù)雜參數(shù)化,但是參數(shù)η的估算是使用常見(jiàn)的回歸命令進(jìn)行的。但是,定義沿兩個(gè)維度的關(guān)系的此類參數(shù)的含義并不簡(jiǎn)單??梢酝ㄟ^(guò)預(yù)測(cè)在具有適當(dāng)暴露值和L + 1滯后的網(wǎng)格上的滯后特定效果來(lái)輔助解釋。此外,可以通過(guò)將滯后特定貢獻(xiàn)相加來(lái)計(jì)算從滯后L到0持續(xù)暴露所預(yù)測(cè)的總體效果。預(yù)測(cè)的效果通過(guò)函數(shù)crosspred()在dlnm中計(jì)算。以下代碼在示例中計(jì)算了對(duì)臭氧和溫度的預(yù)測(cè):

pre.o <- crosspred(basis, odel at = c(0:6,0., .3))

傳遞給crosspred()的前兩個(gè)參數(shù)是“ crossbasis”類的對(duì)象和用于估計(jì)的模型對(duì)象。像上面的第一個(gè)示例一樣,可以通過(guò)at參數(shù)直接指定必須為其預(yù)測(cè)效果的暴露值向量。在這里,我選擇了臭氧中從0到65 μgr / m3的整數(shù),再加上所選閾值的值和10個(gè)單位以上的值(分別為40.3和50.3 μgr / m3)。然后,該函數(shù)調(diào)用crossbasis()來(lái)構(gòu)建預(yù)測(cè)基準(zhǔn),并根據(jù)模型中的參數(shù)生成預(yù)測(cè)效果和標(biāo)準(zhǔn)誤差。結(jié)果是“ crosspred”類的列表對(duì)象,該對(duì)象存儲(chǔ)了預(yù)測(cè)的效果。它包括滯后效應(yīng)矩陣和總體效應(yīng)向量,以及相應(yīng)的標(biāo)準(zhǔn)誤差矩陣和向量。如第5節(jié)所示。例如,臭氧增加10個(gè)單位的總體效果表示為RR和95%置信區(qū)間,可以通過(guò)以下公式得出:

  1. R> pred.o3$allRRfit["50.3"]


R> cbind(lRlow,alRigh)["50.3",]

?

5.描述DLNM

由DLNM估算的二維暴露-反應(yīng)關(guān)系可能難以概括。關(guān)聯(lián)的圖形表示提供了一般描述。調(diào)用高級(jí)函數(shù)plot.default(),persp()和filled.contour()來(lái)生成散點(diǎn)圖,3-D和等高線圖。例如,臭氧和死亡率之間的關(guān)系可以通過(guò)RR進(jìn)行總結(jié),即每次滯后會(huì)比閾值高出10 μgr / m3。該圖如圖1(左)所示,可通過(guò)以下方式獲得:

圖1:在閾值(40.3 μgr / m3)以上的臭氧增加10個(gè)單位時(shí),滯后效應(yīng)(左)和總體效應(yīng)(右)對(duì)死亡率的影響。

R> plot(re.o3)

參數(shù)ptype =“ slices”指定圖的類型,在這種情況下,沿著滯后空間在預(yù)測(cè)值var = 50.3處的預(yù)測(cè)效果矩陣的切片,對(duì)應(yīng)于在40.3 μgr / m3的閾值之上增加了10個(gè)單位。自變量ci表示置信區(qū)間的圖類型。如果使用cumul = TRUE,則繪制累積效果。

根據(jù)概念定義,可以使用兩種不同的觀點(diǎn)來(lái)讀取圖1中的左圖:它表示在第t天以50.3 μgr / m3的臭氧進(jìn)行單次暴露后,未來(lái)每一天的風(fēng)險(xiǎn)增加。

或者,可以繪制總體效果,該總體效果是通過(guò)使用參數(shù)ptype =“ overall”將滯后效應(yīng)相加得出的:

R> plot(pred )

圖2:溫度和全因死亡率之間的暴露-反應(yīng)關(guān)系的三維圖,以25°C為參考。

一種更詳細(xì)的方法來(lái)表示溫度與死亡率之間的平滑關(guān)系,其中樣條函數(shù)已用于定義這兩個(gè)維度的相關(guān)性??梢允褂?-D和等高線圖對(duì)這種復(fù)雜的依賴關(guān)系進(jìn)行一般描述,該圖說(shuō)明了由預(yù)測(cè)效果的整個(gè)網(wǎng)格給出的效果表面。所示的圖是通過(guò)以下方式獲得的:


  1. R> plot(pred.temp, "contour")

參考點(diǎn)(此處為25℃)是crossbasis函數(shù)在crossbasis()中中心的值。

三維圖或等高線圖提供了關(guān)系的全面摘要,但在表示特定預(yù)測(cè)值或滯后值的影響方面的能力有限。下面給出了更全面的圖,該圖片通過(guò)以下方式獲得:

  1. R> plot(pred.temp, "slices

  2. + ci.g , ltensity =20 colr(0)))

圖3(左)顯示了由plot()和lines()中的參數(shù)var選擇的溫度值的預(yù)測(cè)滯后效應(yīng)影響。另外,圖3(右)顯示了針對(duì)特定滯后的沿溫度的預(yù)測(cè)效應(yīng)的多重曲線圖(左),以及圖3(右)中繪制的相同滯后效應(yīng),以及99%的置信區(qū)間。

這些圖表顯示了高溫和低溫影響的不同模式,高溫的影響非常強(qiáng)烈且迅速,低溫影響更為延遲,在最初的滯后中為負(fù)。

6.建模策略

DLNM框架提供了機(jī)會(huì),可以通過(guò)為預(yù)測(cè)變量和滯后變量?jī)蓚€(gè)維度中的每個(gè)維度選擇基本函數(shù)來(lái)指定廣泛的模型選擇。前面各節(jié)中說(shuō)明的示例代表了一種潛在的建模替代方法。為了討論該方法的靈活性以及模型選擇的相關(guān)問(wèn)題,下面顯示了與不同模型的比較,以估計(jì)與溫度的關(guān)聯(lián)。具體來(lái)說(shuō),為預(yù)測(cè)變量的空間選擇多項(xiàng)式和層次函數(shù),同時(shí)保持相同的自然三次樣條,以模擬長(zhǎng)達(dá)30天的滯后分布的滯后曲線。指定交叉基礎(chǔ),運(yùn)行模型并預(yù)測(cè)效果的代碼為:

  1. R> basis.temp2 <- crossbasis(emp, vrtpe = "poly",

  2. R> model2 <- update(mdel, .~. - bsis.emp + baiste2)

  3. R> model3 <- updat(model .~. -bais.tmp + bass.mp3)

對(duì)于預(yù)測(cè)變量,第一種方法建議使用與第5節(jié)中的原始三次樣條相同的自由度的多項(xiàng)式函數(shù)。第二種模型基于一個(gè)更簡(jiǎn)單的雙閾值函數(shù),將單個(gè)閾值置于25°C,之前確定為最低死亡率。此選擇還便于模型比較,因?yàn)檫@是其他兩個(gè)連續(xù)函數(shù)的中心點(diǎn)。這三個(gè)模型估計(jì)的總體效果顯示在由代碼產(chǎn)生的圖4(左)中:

  1. R> plot(predp)

  2. R> lines(temp2, ?col = 3, lty = 2, lwd = 2)

正如預(yù)期的那樣,替代模型會(huì)產(chǎn)生不同的結(jié)果。特別是,如果與具有等距結(jié)點(diǎn)的三次樣條進(jìn)行比較,則多項(xiàng)式模型會(huì)估計(jì)出低溫的“擺動(dòng)”關(guān)系。取而代之的是,這兩個(gè)函數(shù)提供了非常接近的高溫影響估算值。相反,雖然雙閾值模型的線性假設(shè)似乎足以模擬低溫的依賴性,但有一些證據(jù)表明,這種方法往往會(huì)低估熱的影響。估計(jì)的分布滯后曲線的第二次比較如圖4所示(右),如下所示:

  1. R> plot(pred, slices", va =32, im =95 .2="n"


盡管在所有三個(gè)模型中都為滯后空間選擇了完全相同的函數(shù),但對(duì)預(yù)測(cè)變量的不同選擇提供了分布滯后曲線的不同估計(jì)值,與32°C的參考點(diǎn)相比,代表了32°C的影響。

圖4:溫度為32°C時(shí)的總體效應(yīng)(左)和滯后特異性效應(yīng)(右)對(duì)3種替代模型的全因死亡率的影響(以25°C為參考)。芝加哥1987-2000。

特別是,樣條曲線和多項(xiàng)式模型會(huì)產(chǎn)生非常相似的效果(正如預(yù)期的那樣,考慮到高溫度尾部曲線在其他維度上的擬合幾乎相同),而雙閾值模型的曲線顯示出截然不同的形狀。具體而言,由于缺乏此模型的靈活性,因此暗示收獲效果(較長(zhǎng)滯后的負(fù)估計(jì))可能表示偽像。

缺乏通用標(biāo)準(zhǔn),無(wú)法在可用的選擇中選擇總結(jié)關(guān)聯(lián)的最佳模型,從而減輕了對(duì)各種替代產(chǎn)品的規(guī)格要求的這種豐富性。在上面的示例中,我對(duì)樣條線模型表現(xiàn)出了明顯的偏愛(ài)。這種選擇既基于對(duì)函數(shù)屬性的了解,例如靈活性和穩(wěn)定性,又基于給出圖4所示結(jié)果的合理論據(jù)。但是,該結(jié)論是有問(wèn)題的,而不是基于可靠的和一般的統(tǒng)計(jì)選擇標(biāo)準(zhǔn)。此外,結(jié)論是基于幾個(gè)先驗(yàn)的選擇,就像閾值位置或結(jié)數(shù)或多項(xiàng)式次數(shù)一樣。

通常,在DLNM中,可以描述兩個(gè)不同的選擇級(jí)別。第一個(gè)涉及不同函數(shù)的規(guī)范。如上所示,該選擇應(yīng)既基于假設(shè)的暴露反應(yīng)形狀的合理性,又基于復(fù)雜性,可概括性和易于解釋之間的折衷。第二級(jí)重點(diǎn)關(guān)注特定函數(shù)內(nèi)的不同選擇,例如用于定義樣條曲線基的結(jié)的數(shù)量和位置。后者更難解決,盡管不是DLNM開(kāi)發(fā)所固有的。一些研究人員在時(shí)間序列分析中研究了這個(gè)問(wèn)題,提出了基于信息準(zhǔn)則(Akaike,Bayesian和其他變體),偏自相關(guān)或(廣義)交叉驗(yàn)證的方法(Peng等,2006; Baccini等,2006)。2007)。用戶可以在DLNM中應(yīng)用相同的方法,但是他應(yīng)該記住,這些模型的二維性質(zhì)帶來(lái)了額外的復(fù)雜性,例如最大滯后的定義。此外,關(guān)于執(zhí)行不同準(zhǔn)則的依據(jù)還不是結(jié)論性的(Dominici等人,2008年)。需要進(jìn)一步研究以提供有關(guān)DLNM中模型選擇的一些指導(dǎo)。

可以建議使用其他方法。Muggeo(2008)提出了一個(gè)模型,該模型具有對(duì)預(yù)測(cè)變量空間進(jìn)行約束的分段參數(shù)化,以及基于懲罰性樣條的雙重懲罰基于分布滯后的參數(shù)化。此方法包括自動(dòng)選擇閾值和分布滯后曲線的平滑度,并且已在R(Muggeo 2010)中完全實(shí)現(xiàn)。這種方法與靈活的DLNM的比較可以放寬對(duì)預(yù)測(cè)變量維度上形狀的假設(shè),從而可以提供有關(guān)此關(guān)系的其他一些見(jiàn)解。

7.數(shù)據(jù)要求

本文介紹的DLNMs框架是為時(shí)間序列數(shù)據(jù)開(kāi)發(fā)的。(1)中基本模型的一般表達(dá)式允許將此方法應(yīng)用于(廣義)線性模型(GLM)中的任何族分布和鏈接函數(shù),并擴(kuò)展到廣義加法模型(GAM)或基于廣義估計(jì)方程的模型(GEE)。但是,DLNM的當(dāng)前實(shí)現(xiàn)需要一系列等距,完整和有序的數(shù)據(jù)。

還使用選定滯后時(shí)間段中包含的先前觀察值來(lái)計(jì)算一系列轉(zhuǎn)換變量中的每個(gè)值。因此,將轉(zhuǎn)換變量中的第一個(gè)最大滯后觀測(cè)值設(shè)置為NA。允許在x中缺少值,但是由于相同的原因,將相同且下一個(gè)maxlag轉(zhuǎn)換后的值設(shè)置為NA。盡管正確,但對(duì)于零散的缺失觀測(cè)值存在的較長(zhǎng)滯后時(shí)間的DLNM,這可能會(huì)產(chǎn)生計(jì)算問(wèn)題。在這種情況下,可以考慮一些插補(bǔ)方法。

dlnm的主要優(yōu)點(diǎn)之一是,用戶可以使用標(biāo)準(zhǔn)回歸函數(shù)執(zhí)行DLNM,只需在模型公式中包括交叉基矩陣即可。通過(guò)函數(shù)lm(),glm()或gam(),可以直接使用它。但是,用戶可以與數(shù)據(jù)的時(shí)間序列結(jié)構(gòu)兼容地應(yīng)用不同的回歸函數(shù)。這些函數(shù)應(yīng)該具有針對(duì)coef()和vcov()的方法,或者用戶必須提取參數(shù)并將其包含在crosspred()的參數(shù)coef和vcov中(請(qǐng)參見(jiàn)第4節(jié))。

8.最終結(jié)論

DLNM類代表描述描述非線性效應(yīng)和滯后效應(yīng)的現(xiàn)象的統(tǒng)一框架。該模型系列的主要優(yōu)點(diǎn)是在一個(gè)獨(dú)特的框架中統(tǒng)一了許多以前的方法來(lái)處理滯后效應(yīng),還為關(guān)系提供了更靈活的選擇。DLNM的規(guī)范僅涉及選擇兩個(gè)基數(shù)以生成(5)中的交叉基函數(shù),例如,包括線性閾值,層次,多項(xiàng)式和樣條變換。

交叉基和參數(shù)估計(jì)的分離提供了多個(gè)優(yōu)點(diǎn)。首先,如示例中所示,可以通過(guò)交叉基函數(shù)轉(zhuǎn)換多個(gè)顯示滯后效果的變量,并將其包含在模型中。其次,可以使用標(biāo)準(zhǔn)回歸命令進(jìn)行估計(jì),并使用默認(rèn)的診斷工具和相關(guān)函數(shù)集。更重要的是,此實(shí)現(xiàn)提供了一個(gè)開(kāi)放平臺(tái),可以在其中實(shí)現(xiàn)使用不同回歸命令指定的其他模型,來(lái)幫助在其他情況下或研究設(shè)計(jì)中開(kāi)發(fā)方法。

最受歡迎的見(jiàn)解

1.在python中使用lstm和pytorch進(jìn)行時(shí)間序列預(yù)測(cè)

2.python中利用長(zhǎng)短期記憶模型lstm進(jìn)行時(shí)間序列預(yù)測(cè)分析

3.使用r語(yǔ)言進(jìn)行時(shí)間序列(arima,指數(shù)平滑)分析

4.r語(yǔ)言多元copula-garch-模型時(shí)間序列預(yù)測(cè)

5.r語(yǔ)言copulas和金融時(shí)間序列案例

6.使用r語(yǔ)言隨機(jī)波動(dòng)模型sv處理時(shí)間序列中的隨機(jī)波動(dòng)

7.r語(yǔ)言時(shí)間序列tar閾值自回歸模型

8.r語(yǔ)言k-shape時(shí)間序列聚類方法對(duì)股票價(jià)格時(shí)間序列聚類

9.python3用arima模型進(jìn)行時(shí)間序列預(yù)測(cè)


拓端tecdat|R語(yǔ)言分布滯后線性和非線性模型(DLNM)分析空氣污染(臭氧)、溫度對(duì)死亡的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
弥渡县| 札达县| 台湾省| 策勒县| 长兴县| 临安市| 福州市| 武定县| 巴南区| 长春市| 杭州市| 龙山县| 北京市| 托克托县| 海宁市| 简阳市| 崇仁县| 鞍山市| 中牟县| 乡城县| 专栏| 克东县| 巫山县| 中宁县| 灵石县| 苍溪县| 云浮市| 炎陵县| 齐齐哈尔市| 岳西县| 都安| 余庆县| 湖南省| 永兴县| 萨嘎县| 化州市| 资源县| 漠河县| 尚义县| 新邵县| 苏尼特左旗|