最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【視頻】R語(yǔ)言生存分析原理與晚期肺癌患者分析案例|數(shù)據(jù)分享|附代碼數(shù)據(jù)

2023-09-04 23:28 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=10278

最近我們被客戶要求撰寫關(guān)于生存分析的研究報(bào)告,包括一些圖形和統(tǒng)計(jì)輸出。

生存分析(也稱為工程中的可靠性分析)的目標(biāo)是在協(xié)變量和事件時(shí)間之間建立聯(lián)系

生存分析的名稱源于臨床研究,其中預(yù)測(cè)死亡時(shí)間,即生存,通常是主要目標(biāo)。

視頻:R語(yǔ)言生存分析原理與晚期肺癌患者分析案例

**,時(shí)長(zhǎng)08:41

生存分析是一種回歸問(wèn)題(人們想要預(yù)測(cè)一個(gè)連續(xù)值),但有一個(gè)轉(zhuǎn)折點(diǎn)。它與傳統(tǒng)回歸的不同之處在于,在生存分析中,結(jié)果變量既有一個(gè)事件,也有一個(gè)與之相關(guān)的時(shí)間值,部分訓(xùn)練數(shù)據(jù)只能被部分觀察——它們是被刪失的。本文用R語(yǔ)言生存分析晚期肺癌患者數(shù)據(jù)?(?查看文末了解數(shù)據(jù)獲取方式?)。

普通最小二乘回歸方法不足,因?yàn)槭录l(fā)生的時(shí)間通常不是正態(tài)分布的,并且模型無(wú)法處理刪失,但這在生存數(shù)據(jù)中很常見(jiàn)。

為什么要做生存分析:右刪失

在某些情況下,可能無(wú)法觀察到事件時(shí)間:這通常稱為?右刪失。在以死亡為事件的臨床試驗(yàn)中,當(dāng)發(fā)生以下情況之一時(shí),就會(huì)發(fā)生這種情況。1。當(dāng)一定數(shù)量的參與者死亡時(shí),研究結(jié)束。2。參與者退出研究。3。?研究達(dá)到預(yù)定的結(jié)束時(shí)間,并且一些參與者存活到結(jié)束。在每種情況下,幸存的參與者離開(kāi)研究后,我們都不知道他們會(huì)發(fā)生什么。然后我們有一個(gè)問(wèn)題:

當(dāng)對(duì)于某些個(gè)體,我們只觀察到他們的事件時(shí)間的下限時(shí),我們?nèi)绾螌?duì)經(jīng)驗(yàn)分布進(jìn)行建?;蜻M(jìn)行非負(fù)回歸?

上圖說(shuō)明了右刪失。對(duì)于參與者 1,我們看到他們何時(shí)死亡。參與者 2 退出了,我們知道他們一直活到那時(shí),但不知道后來(lái)發(fā)生了什么。對(duì)于參與者 3,我們知道他們活到了預(yù)定的研究結(jié)束,但又不知道之后發(fā)生了什么。

生存函數(shù)和風(fēng)險(xiǎn)函數(shù)

生存分析中的兩個(gè)關(guān)鍵工具是生存函數(shù)和風(fēng)險(xiǎn)函數(shù)。

生存函數(shù):它是一個(gè)函數(shù),用于給出我們有興趣知道的任何對(duì)象是否會(huì)在任何指定時(shí)間之后存活的概率。在數(shù)學(xué)上它可以由以下公式表示?

其中 S(t) 是一個(gè)生存函數(shù),其中 T 是一個(gè)連續(xù)隨機(jī)變量,是一個(gè)事件的時(shí)間。F(t) 是區(qū)間[0,∞) 上的累積分布函數(shù)。

我們也可以用風(fēng)險(xiǎn)函數(shù)來(lái)寫生存函數(shù)。假設(shè)事件尚未發(fā)生?,風(fēng)險(xiǎn)率λ(t) 是事件在時(shí)間t發(fā)生的瞬時(shí)概率的主要值。

那么關(guān)鍵問(wèn)題是如何估計(jì)風(fēng)險(xiǎn)和/或生存函數(shù)。

Kaplan Meier的非參數(shù)估計(jì)

在非參數(shù)生存分析中,我們要估計(jì)生存函數(shù)沒(méi)有協(xié)變量,并且有刪失。如果我們沒(méi)有刪失,我們可以從經(jīng)驗(yàn) CDF 開(kāi)始. 這個(gè)等式簡(jiǎn)潔地表示:

有多少人隨著時(shí)間的推移而死亡? 那么生存函數(shù)就是:還有多少人還活著?

但是,我們無(wú)法回答一些人被時(shí)間t刪失時(shí)提出的這個(gè)問(wèn)題.

雖然我們不一定知道有多少人在任意時(shí)間t幸存下來(lái),我們知道研究中有多少人仍然處于風(fēng)險(xiǎn)之中。我們可以使用它來(lái)代替。將學(xué)習(xí)時(shí)間劃分區(qū)間, 其中每個(gè)ti是參與者的事件時(shí)間或刪失時(shí)間。假設(shè)參與者只能在觀察到的事件時(shí)間失效。假設(shè)沒(méi)有人在同一時(shí)間死去(沒(méi)有關(guān)系),我們可以查看每次有人死去的時(shí)間。我們說(shuō)在那個(gè)特定時(shí)間死亡的概率是,并說(shuō)在任何其他時(shí)間死亡的概率是0.

在溫和的假設(shè)下,包括參與者具有獨(dú)立且相同分布的事件時(shí)間,并且刪失和事件時(shí)間是獨(dú)立的,這給出了一個(gè)一致的估計(jì)量。上圖給出了一個(gè)簡(jiǎn)單案例的 Kaplan Meier 估計(jì)示例。

生存分析用于各種領(lǐng)域

例如:

  • 用于患者生存時(shí)間分析的癌癥研究,

  • “事件歷史分析”的社會(huì)學(xué),

  • 在工程中用于“故障時(shí)間分析”。

在癌癥研究中,典型的研究問(wèn)題如下:

  • 某些臨床特征對(duì)患者生存有何影響

  • 一個(gè)人能活3年的概率是多少?

  • 患者組之間的生存率是否存在差異?

?

?

第1部分:生存分析簡(jiǎn)介?

本演示文稿將介紹生存分析 ,參考:

Clark, T., Bradburn, M., Love, S., & Altman, D. (2003). Survival analysis part I: Basic concepts and first analyses. 232-238. ISSN 0007-0920.

我們今天將使用的一些軟件包包括:

  • lubridate


library(survival)

什么是生存數(shù)據(jù)?

事件時(shí)間數(shù)據(jù)由不同的開(kāi)始時(shí)間和結(jié)束時(shí)間組成。

癌癥的例子

  • 從手術(shù)到死亡的時(shí)間

  • 從治療開(kāi)始到進(jìn)展的時(shí)間

  • 從響應(yīng)到復(fù)發(fā)的時(shí)間

其他領(lǐng)域的例子

事件發(fā)生時(shí)間數(shù)據(jù)在許多領(lǐng)域都很常見(jiàn),包括但不限于

  • 從艾滋病毒感染到艾滋病發(fā)展的時(shí)間

  • 心臟病發(fā)作的時(shí)間

  • 藥物濫用發(fā)生的時(shí)間

  • 機(jī)器故障時(shí)間

生存分析別名

由于生存分析在許多其他領(lǐng)域很常見(jiàn),因此也有其他名稱

  • 可靠性分析

  • 持續(xù)時(shí)間分析

  • 事件歷史分析

  • 事件發(fā)生時(shí)間分析

肺數(shù)據(jù)集

數(shù)據(jù)包含來(lái)自北中部癌癥治療組的晚期肺癌患者。今天我們將用來(lái)演示方法的一些變量包括

  • 時(shí)間:以天為單位的生存時(shí)間

  • 狀態(tài):刪失狀態(tài)1 =刪失,2 =失效

  • 性別:男= 1女= 2

刪失類型

某個(gè)主題可能由于以下原因而被刪失:

  • 后續(xù)損失

  • 退出研究

  • 固定學(xué)習(xí)期結(jié)束前沒(méi)有活動(dòng)

具體來(lái)說(shuō),這些是刪失的示例。

分配隨訪時(shí)間

  • 受刪失的主題仍會(huì)提供信息,因此必須適當(dāng)?shù)匕诜治鲋?/p>

  • 隨訪時(shí)間的分布存在偏差,在接受檢查的患者和有事件的患者之間可能有所不同

生存數(shù)據(jù)的組成部分

對(duì)于主題ii:

  • 活動(dòng)時(shí)間Ti

  • 刪失時(shí)間Ci

  • 事件指標(biāo)δi:

  • 1,如果觀察到的事件(即??Ti≤CiTi≤Ci)

  • 如果檢查,則為0(即??Ti>CiTi>Ci)

  1. 觀測(cè)時(shí)間Yi=min(Ti,Ci)Yi=min(Ti,Ci)

lung數(shù)據(jù)中提供了觀察時(shí)間和事件指示

  • 時(shí)間:以天為單位的生存時(shí)間(YiYi)

  • 狀態(tài):刪失狀態(tài)1 =刪失,2 =死亡(δiδi)

在R中處理日期

數(shù)據(jù)通常帶有開(kāi)始日期和結(jié)束日期,而不是預(yù)先計(jì)算的生存時(shí)間。第一步是確保將這些格式設(shè)置為R中的日期。

讓我們創(chuàng)建一個(gè)小的示例數(shù)據(jù)集,其中sx_date包含手術(shù)日期和last_fup_date上次隨訪日期的變量。

date_ex?<-???tibble(????sx_date?=?c("2007-06-22",?"2004-02-13",?"2010-10-27"),?????last_fup_date?=?c("2017-04-15",?"2018-07-04",?"2016-10-31")????)date_ex

##?#?A?tibble:?3?x?2##???sx_date????last_fup_date##???<chr>??????<chr>????????##?1?2007-06-22?2017-04-15???##?2?2004-02-13?2018-07-04???##?3?2010-10-27?2016-10-31

我們看到它們都是字符變量,通常都是這種情況,但是我們需要將它們格式化為日期。

格式化日期-基數(shù)R

date_ex?%>%???mutate(????sx_date?=?as.Date(sx_date,?format?=?"%Y-%m-%d"),?????last_fup_date?=?as.Date(last_fup_date,?format?=?"%Y-%m-%d")?????)

##?#?A?tibble:?3?x?2##???sx_date????last_fup_date##???<date>?????<date>???????##?1?2007-06-22?2017-04-15???##?2?2004-02-13?2018-07-04???##?3?2010-10-27?2016-10-31

  • 請(qǐng)注意,R格式必須包含分隔符和符號(hào)。例如,如果您的日期格式為m / d / Y,則需要format = "%m/%d/%Y"

格式化日期-lubridate程序包

我們還可以使用該lubridate包來(lái)格式化日期。在這種情況下,請(qǐng)使用ymd功能

date_ex?%>%???mutate(????sx_date?=?ymd(sx_date),?????last_fup_date?=?ymd(last_fup_date)????)

##?#?A?tibble:?3?x?2##???sx_date????last_fup_date##???<date>?????<date>???????##?1?2007-06-22?2017-04-15???##?2?2004-02-13?2018-07-04???##?3?2010-10-27?2016-10-31

  • 請(qǐng)注意,與基本R選項(xiàng)不同,不需要指定分隔符

計(jì)算生存時(shí)間?

現(xiàn)在日期已格式化,我們需要以某些單位(通常是幾個(gè)月或幾年)計(jì)算開(kāi)始時(shí)間和結(jié)束時(shí)間之間的差。在base中R,用于difftime計(jì)算兩個(gè)日期之間的天數(shù),然后使用將其轉(zhuǎn)換為數(shù)字值as.numeric。然后將除以365.25年的平均天數(shù)轉(zhuǎn)換為年。

date_ex?%>%???mutate(????os_yrs?=???????as.numeric(????????difftime(last_fup_date,??????????????????sx_date,??????????????????units?=?"days"))?/?365.25????)

##?#?A?tibble:?3?x?3##???sx_date????last_fup_date?os_yrs##???<date>?????<date>?????????<dbl>##?1?2007-06-22?2017-04-15??????9.82##?2?2004-02-13?2018-07-04?????14.4?##?3?2010-10-27?2016-10-31??????6.01

計(jì)算生存時(shí)間?

操作員可以%--%指定一個(gè)時(shí)間間隔,然后使用將該時(shí)間間隔轉(zhuǎn)換為經(jīng)過(guò)的秒數(shù)as.duration,最后除以dyears(1),將其轉(zhuǎn)換為年數(shù),從而得出一年中的秒數(shù)。

##?#?A?tibble:?3?x?3##???sx_date????last_fup_date?os_yrs##???<date>?????<date>?????????<dbl>##?1?2007-06-22?2017-04-15??????9.82##?2?2004-02-13?2018-07-04?????14.4?##?3?2010-10-27?2016-10-31??????6.02

事件標(biāo)標(biāo)

對(duì)于生存數(shù)據(jù)的組成部分,我提到了事件指示器:

事件指標(biāo)δiδi:

  • 1,如果觀察到的事件(即??Ti≤CiTi≤Ci)

  • 如果檢查,則為0(即??Ti>CiTi>Ci)

lung數(shù)據(jù)中,我們有:

  • 狀態(tài):刪失狀態(tài)1 =刪失,2 =失效

生存函數(shù)

受試者可以存活超過(guò)指定時(shí)間的概率

S(t)=Pr(T>t)=1?F(t)S(t)=Pr(T>t)=1?F(t)

S(t)S(t):生存函數(shù)F(t)=Pr(T≤t)F(t)=Pr(T≤t):累積分布函數(shù)

理論上,生存函數(shù)是平滑的;在實(shí)踐中,我們以離散的時(shí)間尺度觀察事件。

生存概率

  • 生存概率在某個(gè)時(shí)間,S(t)S(t),是存活超過(guò)該時(shí)間,考慮到個(gè)體已存活剛剛在此之前,時(shí)間的條件概率。

  • 可以估計(jì)為當(dāng)時(shí)活著但沒(méi)有損失的隨訪患者人數(shù)除以當(dāng)時(shí)的活著患者人數(shù)

  • 生存概率的Kaplan-Meier估計(jì)是這些條件概率的乘積

  • 在時(shí)間0,生存概率為1,即??S(t0)=1S(t0)=1

創(chuàng)建生存對(duì)象

Kaplan-Meier方法是估計(jì)生存時(shí)間和概率的最常用方法。這是一種非參數(shù)方法,可產(chǎn)生階躍函數(shù),每次事件發(fā)生時(shí),階躍下降。

  • 創(chuàng)建一個(gè)生存對(duì)象。對(duì)于每個(gè)主題,將有一個(gè)條目作為生存時(shí)間,+如果主題是經(jīng)過(guò)刪失的,則后面跟一個(gè)。讓我們看一下前10個(gè)觀察值:

##??[1]??306???455??1010+??210???883??1022+??310???361???218???166

用Kaplan-Meier方法估算生存曲線

  • survfit函數(shù)根據(jù)公式創(chuàng)建生存曲線。讓我們?yōu)檎麄€(gè)同類群組生成總體生存曲線,將其分配給object?f1,然后查看names該對(duì)象的:

names(f1)

##??[1]?"n"??????????"time"???????"n.risk"?????"n.event"????"n.censor"??##??[6]?"surv"???????"std.err"????"cumhaz"?????"std.chaz"???"start.time"##?[11]?"type"???????"logse"??????"conf.int"???"conf.type"??"lower"?????##?[16]?"upper"??????"call"

survfit對(duì)象將用于創(chuàng)建生存曲線的一些關(guān)鍵組件包括:

  • time,其中包含每個(gè)時(shí)間間隔的起點(diǎn)和終點(diǎn)

  • surv,其中包含每個(gè)對(duì)應(yīng)的生存概率?time

Kaplan-Meier圖?

現(xiàn)在, 繪制對(duì)象 獲得Kaplan-Meier圖。

plot(survfit(Surv(time,?status)?~?1,?data?=?lung),?????

  • 基數(shù)R中的默認(rèn)圖顯示了具有相關(guān)置信區(qū)間(虛線)的階躍函數(shù)(實(shí)線)

  • 水平線代表間隔的生存時(shí)間

  • 時(shí)間間隔由事件終止

  • 垂直線的高度顯示累積概率的變化

  • 帶有刻度線的經(jīng)過(guò)刪失的觀察結(jié)果會(huì)減少間隔之間的累積生存期。

Kaplan-Meier圖?

建立在上ggplot2,并可用于創(chuàng)建Kaplan-Meier圖。

點(diǎn)擊標(biāo)題查閱往期內(nèi)容

R語(yǔ)言生存分析數(shù)據(jù)分析可視化案例

左右滑動(dòng)查看更多

01

02

03

04

  • 默認(rèn)圖??帶相關(guān)置信帶(陰影區(qū)域)的階躍函數(shù)(實(shí)線)。

  • 默認(rèn)情況下,顯示了被檢查患者的刻度線,在此示例中,該刻度線本身有些模糊,可以使用選項(xiàng)將其取消?censor = FALSE

估計(jì)xx年生存

生存分析中經(jīng)常需要關(guān)注的一個(gè)數(shù)量是生存超過(guò)一定數(shù)量(xx)年的概率。

例如,要估算生存到11年的可能性

##?Call:?survfit(formula?=?Surv(time,?status)?~?1,?data?=?lung)##?##??time?n.risk?n.event?survival?std.err?lower?95%?CI?upper?95%?CI##???365?????65?????121????0.409??0.0358????????0.345????????0.486

我們發(fā)現(xiàn)本研究中11年生存的機(jī)率是41%。

同時(shí)顯示95%置信區(qū)間的相關(guān)上下限。

xx年生存率和生存曲線

11年存活率概率為在y軸上的點(diǎn)對(duì)應(yīng)于11一年x軸的生存曲線。

Xx年生存率常常被錯(cuò)誤估計(jì)

如果 使用“天真”的估計(jì)會(huì)怎樣?

228名患者中的121名到1年時(shí)死亡,因此:

-當(dāng) 忽略42名患者在1年之前受到檢查的事實(shí)時(shí), 會(huì)錯(cuò)誤估計(jì)1個(gè)1個(gè)年生存率。

  • 正確的估計(jì)生存概率-年為41%。

忽略刪失對(duì)xx年生存的影響

  • 想象兩個(gè)研究,每個(gè)研究228個(gè)主題。每個(gè)研究中有165人死亡。一個(gè)沒(méi)有檢查(紅色線),63個(gè)病人被另一個(gè)(藍(lán)色線)檢查

  • 忽略刪失會(huì)導(dǎo)致總體生存概率被高估,因?yàn)楸粍h失的受試者僅在部分隨訪時(shí)間內(nèi)提供信息,然后落入風(fēng)險(xiǎn)范圍之外,從而降低了生存的累積概率

估計(jì)中位生存時(shí)間

生存分析中經(jīng)常需要關(guān)注的另一個(gè)數(shù)量是平均生存時(shí)間,我們使用中位數(shù)對(duì)其進(jìn)行量化。預(yù)計(jì)生存時(shí)間不會(huì)呈正態(tài)分布,因此平均值不是適當(dāng)?shù)目偨Y(jié)。

##?Call:?survfit(formula?=?Surv(time,?status)?~?1,?data?=?lung)##?##???????n??events??median?0.95LCL?0.95UCL?##?????228?????165?????310?????285?????363

我們看到中位生存時(shí)間為310天。還會(huì)顯示95%置信區(qū)間的上限和下限。

中位生存時(shí)間和生存曲線

中位生存時(shí)間是生存概率為0.50?

中位生存率常常被錯(cuò)誤估計(jì)

總結(jié)165例死亡患者的中位生存時(shí)間

##???median_surv##?1?????????226

  • 當(dāng) 忽略被檢查患者也有助于隨訪的事實(shí)時(shí), 會(huì)得出錯(cuò)誤的估計(jì)中值生存時(shí)間226天。

  • 正確的中位生存時(shí)間估計(jì)是310天。

忽略刪失對(duì)中位數(shù)生存率的影響

  • 忽略刪失會(huì)造成人為降低的生存曲線,因?yàn)榕懦耸軇h失患者貢獻(xiàn)的隨訪時(shí)間(紫色線)

  • 數(shù)據(jù)的真實(shí)生存曲線以lung藍(lán)色顯示,以進(jìn)行比較

比較各組之間的生存時(shí)間

  • 我們可以使用對(duì)數(shù)秩檢驗(yàn)進(jìn)行組間重要性檢驗(yàn)

  • 對(duì)數(shù)秩檢驗(yàn)在整個(gè)隨訪時(shí)間內(nèi)平均權(quán)衡觀察結(jié)果,是比較組間生存時(shí)間的最常用方法

  • 根據(jù)研究問(wèn)題,有些版本可能會(huì)更重視早期或后期的隨訪,可能更合適

我們使用 函數(shù)獲得對(duì)數(shù)秩p值。例如,我們可以根據(jù)lung數(shù)據(jù)中的性別測(cè)試是否存在生存時(shí)間差異

##?Call:##?##?????????N?Observed?Expected?(O-E)^2/E?(O-E)^2/V##?sex=1?138??????112?????91.6??????4.55??????10.3##?sex=2??90???????53?????73.4??????5.68??????10.3##?##??Chisq=?10.3??on?1?degrees?of?freedom,?p=?0.001

從survdiff對(duì)象中提取信息

從 結(jié)果中提取p值

1?-?pchisq(sd$chisq,?length(sd$n)?-?1)

##?[1]?0.001311165

返回格式化的p值

##?[1]?0.001

Cox回歸模型

我們可能想量化單個(gè)變量的效應(yīng)大小,或者將多個(gè)變量包括在回歸模型中以說(shuō)明多個(gè)變量的效應(yīng)。

Cox回歸模型是半?yún)?shù)模型,可用于擬合具有生存結(jié)果的單變量和多變量回歸模型。

h(t)h(t):危險(xiǎn)或事件發(fā)生的瞬時(shí)速率h0(t)h0(t):基本基準(zhǔn)危險(xiǎn)

該模型的一些關(guān)鍵假設(shè):

  • 非信息刪失

  • 比例危險(xiǎn)

注意:也可以使用用于生存結(jié)果的參數(shù)回歸模型,但是本培訓(xùn)將不涉及這些模型。

我們可以使用coxph函數(shù)擬合生存數(shù)據(jù)的回歸模型,該函數(shù)Surv在左側(cè)使用一個(gè)對(duì)象,而在右側(cè)具有用于回歸公式的標(biāo)準(zhǔn)語(yǔ)法R。

##?Call:##?##????????coef?exp(coef)?se(coef)??????z???????p##?sex?-0.5310????0.5880???0.1672?-3.176?0.00149##?##?Likelihood?ratio?test=10.63??on?1?df,?p=0.001111##?n=?228,?number?of?events=?165

格式化Cox回歸結(jié)果

我們可以看到輸出的整潔版本broom

或使用

危險(xiǎn)比

  • 來(lái)自Cox回歸模型的關(guān)注數(shù)量是危險(xiǎn)比(HR)。HR表示在任何特定時(shí)間點(diǎn)兩組之間的危險(xiǎn)比率。

  • HR被解釋為感興趣事件中那些仍處于事件風(fēng)險(xiǎn)中的事件的瞬時(shí)發(fā)生率。

  • 如果您有一個(gè)回歸參數(shù)ββ(來(lái)自estimate我們的列coxph),則HR =?經(jīng)驗(yàn)值(β)經(jīng)驗(yàn)值?(β)。

  • HR <1表示死亡危險(xiǎn)降低,而HR> 1表示死亡危險(xiǎn)增加。

  • 因此,我們的HR = 0.59意味著在任何給定時(shí)間,女性死亡的人數(shù)大約是男性的0.6倍。

第2部分:地標(biāo)分析和時(shí)間相關(guān)協(xié)變量

在第1部分中,我們介紹了使用對(duì)數(shù)秩檢驗(yàn)和Cox回歸來(lái)檢驗(yàn)感興趣的協(xié)變量與生存結(jié)果之間的關(guān)聯(lián)。

示例:腫瘤反應(yīng)

示例:從治療開(kāi)始就測(cè)量總生存期,關(guān)注的是對(duì)治療的完全反應(yīng)與生存之間的關(guān)聯(lián)。

  • Anderson等人(JCO,1983)描述了在這種情況下,為什么傳統(tǒng)方法(如對(duì)數(shù)秩檢驗(yàn)或Cox回歸)偏向于響應(yīng)者,并提出了劃時(shí)代的方法。

  • 界標(biāo)方法中的零假設(shè)是,從界標(biāo)生存的過(guò)程不依賴于界標(biāo)的響應(yīng)狀態(tài)。

Anderson, J., Cain, K., & Gelber, R. (1983). Analysis of survival by tumor response. Journal of Clinical Oncology : Official Journal of the American Society of Clinical Oncology, 1(11), 710-9.

其他例子

癌癥研究中可能尚未關(guān)注的其他一些可能的協(xié)變量包括:

  • 移植失敗

  • 移植物抗宿主病

  • 第二次切除

  • 輔助治療

  • 合規(guī)

  • 不良事件

示例數(shù)據(jù)?

137例骨髓移植患者的數(shù)據(jù)。變量包括:

  • T1?死亡時(shí)間或最后一次隨訪時(shí)間(天)

  • delta1死亡指標(biāo);1死0活

  • TA?急性移植物抗宿主病的時(shí)間(以天為單位)

  • deltaA急性移植物抗宿主病指標(biāo);1-發(fā)展為急性移植物抗宿主病,0-從未發(fā)展為急性移植物抗宿主病

讓我們加載數(shù)據(jù)以供整個(gè)示例使用

地標(biāo)法

  1. 選擇基線之后的固定時(shí)間作為界標(biāo)時(shí)間。注意:應(yīng)在檢查數(shù)據(jù)之前根據(jù)臨床信息進(jìn)行操作

  2. 那些人群的子集至少跟蹤到里程碑時(shí)間。注意:請(qǐng)務(wù)必在地標(biāo)時(shí)間之前報(bào)告由于關(guān)注或刪失事件而排除的號(hào)碼。

  3. 計(jì)算具有里程碑意義的時(shí)間,并應(yīng)用傳統(tǒng)的對(duì)數(shù)秩檢驗(yàn)或Cox回歸

BMT數(shù)據(jù)感興趣的是急性移植物抗宿主病(aGVHD)和存活之間的關(guān)聯(lián)。但是aGVHD是在移植后進(jìn)行評(píng)估的,這是我們的基線,也就是后續(xù)隨訪的開(kāi)始時(shí)間。

步驟1選擇地標(biāo)時(shí)間

通常,aGVHD發(fā)生在移植后的前90天內(nèi),因此我們使用90天的界標(biāo)。

人們對(duì)急性移植物抗宿主?。╝GVHD)與生存之間的關(guān)系感興趣。但是aGVHD是在移植后進(jìn)行評(píng)估的,這是我們的基線,也就是后續(xù)隨訪的開(kāi)始時(shí)間。

第2步:至少跟蹤到里程碑時(shí)間之前的人群的子集

這將我們的樣本量從137減少到122。

  • 所有15位被排除的患者均在90天里程碑之前死亡

人們對(duì)急性移植物抗宿主?。╝GVHD)與生存之間的關(guān)系感興趣。但是aGVHD是在移植后進(jìn)行評(píng)估的,這是我們的基線,也就是后續(xù)隨訪的開(kāi)始時(shí)間。

步驟3根據(jù)地標(biāo)計(jì)算隨訪時(shí)間,并應(yīng)用傳統(tǒng)方法。

使用BMT數(shù)據(jù)的Cox回歸界標(biāo)示例

在Cox回歸中, 可以使用中的subset選項(xiàng)coxph來(lái)排除那些在標(biāo)志性時(shí)間內(nèi)沒(méi)有被隨訪的患者

時(shí)間相關(guān)協(xié)變量

界標(biāo)分析的替代方法是合并時(shí)間相關(guān)的協(xié)變量。這可能更適合

  • 協(xié)變量的值隨時(shí)間變化

  • 沒(méi)有明顯的里程碑時(shí)間

時(shí)間相關(guān)協(xié)變量數(shù)據(jù)設(shè)置

對(duì)時(shí)間相關(guān)協(xié)變量的分析R需要建立特殊的數(shù)據(jù)集。?

BMT數(shù)據(jù)中沒(méi)有ID變量,這是創(chuàng)建特殊數(shù)據(jù)集所必需的,因此請(qǐng)創(chuàng)建一個(gè)名為的變量my_id。

tmerge函數(shù)與event和函數(shù)一起使用tdc可創(chuàng)建特殊數(shù)據(jù)集。

  • tmerge?為每個(gè)患者的不同協(xié)變量值創(chuàng)建一個(gè)具有多個(gè)時(shí)間間隔的長(zhǎng)數(shù)據(jù)集

  • event?創(chuàng)建新的事件指示器,以與新創(chuàng)建的時(shí)間間隔一致

  • tdc?創(chuàng)建與時(shí)間相關(guān)的協(xié)變量指標(biāo),以與新創(chuàng)建的時(shí)間間隔一致

時(shí)間相關(guān)協(xié)變量-單例患者

要了解其作用,讓我們看一下前5名患者的數(shù)據(jù)。

?##???my_id???T1?delta1???TA?deltaA##?1?????1?2081??????0???67??????1##?2?????2?1602??????0?1602??????0##?3?????3?1496??????0?1496??????0##?4?????4?1462??????0???70??????1##?5?????5?1433??????0?1433??????0

這些相同患者的新數(shù)據(jù)集

##???my_id???T1?delta1?id?tstart?tstop?death?agvhd##?1?????1?2081??????0??1??????0????67?????0?????0##?2?????1?2081??????0??1?????67??2081?????0?????1##?3?????2?1602??????0??2??????0??1602?????0?????0##?4?????3?1496??????0??3??????0??1496?????0?????0##?5?????4?1462??????0??4??????0????70?????0?????0##?6?????4?1462??????0??4?????70??1462?????0?????1##?7?????5?1433??????0??5??????0??1433?????0?????0

時(shí)間相關(guān)協(xié)變量-Cox回歸

現(xiàn)在,我們可以分析這個(gè)時(shí)間依賴性協(xié)照常使用Cox回歸與coxph?

摘要

我們發(fā)現(xiàn),使用標(biāo)志性分析或時(shí)間依賴性協(xié)變量,急性移植物抗宿主病與死亡無(wú)顯著相關(guān)性。

通常,人們會(huì)希望使用地標(biāo)分析對(duì)單個(gè)協(xié)變量進(jìn)行可視化, 使用帶有時(shí)間相關(guān)協(xié)變量的Cox回歸進(jìn)行單變量和多變量建模。

第3部分:競(jìng)爭(zhēng)風(fēng)險(xiǎn)

什么是競(jìng)爭(zhēng)風(fēng)險(xiǎn)?

當(dāng)對(duì)象在事件發(fā)生時(shí)間設(shè)置中發(fā)生多個(gè)可能的事件時(shí)

例子:

  • 復(fù)發(fā)

  • 因疾病死亡

  • 因其他原因死亡

  • 治療反應(yīng)

在任何給定的研究中,所有這些(或其中一些 以及其他)可能都是可能的事件。

所以有什么問(wèn)題?

事件時(shí)間之間未觀察到的依賴性是導(dǎo)致需要特殊考慮的基本問(wèn)題。

例如,可以想象復(fù)發(fā)的患者更有可能死亡,因此復(fù)發(fā)時(shí)間和死亡時(shí)間將不是獨(dú)立事件。

競(jìng)爭(zhēng)風(fēng)險(xiǎn)的背景

存在多種潛在結(jié)果時(shí)的兩種分析方法:

  1. 給定事件的特定于原因的危險(xiǎn):這表示未因其他事件而失敗的事件中事件的每單位時(shí)間的發(fā)生率

  2. 給定事件的累積發(fā)生率:這表示事件每單位時(shí)間的發(fā)生率以及競(jìng)爭(zhēng)事件的影響

這些方法中的每一種都可能僅闡明數(shù)據(jù)的一個(gè)重要方面,而有可能使其他方面難以理解,因此所選的方法應(yīng)取決于感興趣的問(wèn)題。

?黑色素瘤數(shù)據(jù)示例

它包含變量:

  • time?生存時(shí)間以天為單位,可能經(jīng)過(guò)刪失。

  • status?1例死于黑色素瘤,2例存活,3例因其他原因死亡。

  • sex?1 =男性,0 =女性。

  • age?年歲。

  • year?操作。

  • thickness?腫瘤厚度(毫米)。

  • ulcer?1 =存在,0 =不存在。

黑色素瘤數(shù)據(jù)的累積發(fā)生率

在競(jìng)爭(zhēng)風(fēng)險(xiǎn)的背景下估算累積發(fā)生率。

##?Estimates?and?Variances:##?$est##???????????1000???????2000???????3000??????4000??????5000##?1?1?0.12745714?0.23013963?0.30962017?0.3387175?0.3387175##?1?3?0.03426709?0.05045644?0.05811143?0.1059471?0.1059471##?##?$var##?????????????1000?????????2000?????????3000????????4000????????5000##?1?1?0.0005481186?0.0009001172?0.0013789328?0.001690760?0.001690760##?1?3?0.0001628354?0.0002451319?0.0002998642?0.001040155?0.001040155

繪制累積發(fā)生率-基數(shù)R

生成 默認(rèn)值的基本圖。

plot(ci_fit)

繪制累積發(fā)生率?

比較組之間的累積發(fā)生率

用于組間測(cè)試。

例如,Melanoma根據(jù)ulcer潰瘍的存在與否比較結(jié)果。測(cè)試結(jié)果可以在中找到Tests。

ci_ulcer[["Tests"]]

##????????stat???????????pv?df##?1?26.120719?3.207240e-07??1##?3??0.158662?6.903913e-01??1

按組繪制累積發(fā)生率?

按組繪制累積發(fā)生率-手動(dòng)

_請(qǐng)注意,_我個(gè)人發(fā)現(xiàn)該ggcompetingrisks功能缺少自定義功能,尤其是與相比ggsurvplot。我通常會(huì)自己做圖,首先創(chuàng)建cuminc擬合結(jié)果的整潔數(shù)據(jù)集,然后再繪制結(jié)果。有關(guān)底層代碼的詳細(xì)信息,請(qǐng)參見(jiàn)此演示文稿的

繪制單個(gè)事件類型?

通常,只有一種類型的事件會(huì)引起人們的興趣,盡管我們?nèi)砸紤]競(jìng)爭(zhēng)事件。在那種情況下,感興趣的事件可以單獨(dú)繪制。同樣,我首先通過(guò)創(chuàng)建cuminc擬合結(jié)果的整潔數(shù)據(jù)集,然后繪制結(jié)果來(lái)手動(dòng)執(zhí)行此操作。有關(guān)底層代碼的詳細(xì)信息,請(qǐng)參見(jiàn)此演示文稿的源代碼。

在風(fēng)險(xiǎn)表中添加數(shù)字

您可能想將風(fēng)險(xiǎn)表的數(shù)量添加到累積發(fā)生率圖中,而據(jù)我所知,沒(méi)有簡(jiǎn)單的方法可以做到這一點(diǎn)。請(qǐng)參閱此演示文稿的源代碼中的一個(gè)示例


競(jìng)爭(zhēng)風(fēng)險(xiǎn)回歸

兩種方法:

  1. 特定原因風(fēng)險(xiǎn)

  • 當(dāng)前沒(méi)有事件的受試者中給定事件類型的瞬時(shí)發(fā)生率

  • 使用Cox回歸估算

  1. Subdistribution子分布風(fēng)險(xiǎn)

  • 給定類型事件在沒(méi)有經(jīng)歷過(guò)此類事件的受試者中的瞬時(shí)發(fā)生率

  • 使用Fine-Gray回歸估算

黑色素瘤數(shù)據(jù)中的競(jìng)爭(zhēng)風(fēng)險(xiǎn)回歸-子分布風(fēng)險(xiǎn)法Subdistribution

假設(shè)我們有興趣研究年齡和性別對(duì)黑色素瘤死亡的影響,而其他原因的死亡則是競(jìng)爭(zhēng)事件。

  • crr?需要指定協(xié)變量作為矩陣

  • 如果 關(guān)注多個(gè)事件,則可以使用failcode選項(xiàng)請(qǐng)求其他事件的結(jié)果,默認(rèn)情況下會(huì)返回failcode = 1

shr_fit

##?convergence:??TRUE?##?coefficients:##?????sex?????age?##?0.58840?0.01259?##?standard?errors:##?[1]?0.271800?0.009301##?two-sided?p-values:##??sex??age?##?0.03?0.18

在上一個(gè)示例中,sex和和age均被編碼為數(shù)字變量。如果存在字符變量,則必須使用model.matrix

格式化來(lái)自crr的結(jié)果

或當(dāng)前crr不支持的輸出。?

黑色素瘤數(shù)據(jù)中的競(jìng)爭(zhēng)風(fēng)險(xiǎn)回歸-因果分析

刪失所有沒(méi)有引起關(guān)注的對(duì)象,在這種情況下是由于黑色素瘤死亡,并且照常使用coxph。因此,現(xiàn)在對(duì)因其他原因死亡的患者進(jìn)行針對(duì)特定原因的風(fēng)險(xiǎn)評(píng)估方法以應(yīng)對(duì)競(jìng)爭(zhēng)風(fēng)險(xiǎn)。

第4部分:高級(jí)主題

?涵蓋的內(nèi)容

  • 生存分析的基礎(chǔ)知識(shí),包括Kaplan-Meier生存函數(shù)和Cox回歸

  • 地標(biāo)分析和時(shí)間相關(guān)協(xié)變量

  • 競(jìng)爭(zhēng)風(fēng)險(xiǎn)分析的累積發(fā)生率和回歸

還有什么?

可能會(huì)出現(xiàn)很多零碎的東西 :

  1. 評(píng)估比例風(fēng)險(xiǎn)假設(shè)

  2. 生存率繪制平滑的生存圖XX

  3. 有條件的生存

評(píng)估比例風(fēng)險(xiǎn)

Cox比例風(fēng)險(xiǎn)回歸模型的一個(gè)假設(shè)是,在整個(gè)隨訪過(guò)程中,風(fēng)險(xiǎn)在每個(gè)時(shí)間點(diǎn)都是成比例的。我們?nèi)绾螜z查數(shù)據(jù)是否符合此假設(shè)?

使用cox.zph生存包中的功能。結(jié)果有兩點(diǎn):

  1. 每個(gè)協(xié)變量的效果是否隨時(shí)間變化的假設(shè)檢驗(yàn),以及一次所有協(xié)變量的全局檢驗(yàn)。

  • 這是通過(guò)證明協(xié)變量和log(time)之間的交互作用來(lái)完成的

  • 顯著的p值表示違反了比例風(fēng)險(xiǎn)假設(shè)

  1. Schoenfeld殘差圖

  • 偏離零坡度線的證據(jù)表明違反了比例風(fēng)險(xiǎn)假設(shè)

print(cz)

##????????????rho?chisq?????p##?sex?????0.1236?2.452?0.117##?age????-0.0275?0.129?0.719##?GLOBAL??????NA?2.651?0.266``````plot(cz)

平滑的生存圖-生存分位數(shù)

有時(shí)可能想根據(jù)連續(xù)變量來(lái)可視化生存估計(jì)。求 生存數(shù)據(jù)的分位數(shù)。默認(rèn)分位數(shù)是p = 0.5中位生存期。

  • x代表事件

  • o代表刪失

  • 該線是根據(jù)年齡的平均存活率的平滑估計(jì)

條件生存

有時(shí),在已經(jīng)存活了一段時(shí)間的患者中產(chǎn)生存活率估計(jì)值很有意義。

Zabor, E., Gonen, M., Chapman, P., & Panageas, K. (2013). Dynamic prognostication using conditional survival estimates. Cancer, 119(20), 3589-3592.

條件生存估計(jì)

讓我們將生存期定為6個(gè)月

map_df(??prob_times,???~conditional_surv_est(????basekm?=?fit1,?????t1?=?182.625,?????t2?=?.x)???)?%>%???mutate(months?=?round(prob_times?/?30.4))?%>%???select(months,?everything())?%>%???kable()

條件生存圖

我們還可以根據(jù)不同的生存時(shí)間長(zhǎng)度可視化條件生存數(shù)據(jù)。?

所得出的曲線在我們每次進(jìn)行條件調(diào)整時(shí)都有一條生存曲線。在這種情況下,第一條線是總體生存曲線,因?yàn)樗歉鶕?jù)時(shí)間0進(jìn)行調(diào)節(jié)的。

點(diǎn)擊標(biāo)題查閱往期內(nèi)容

R語(yǔ)言使用限制平均生存時(shí)間RMST比較兩條生存曲線分析肝硬化患者
生存分析模型的時(shí)間依賴性ROC曲線可視化R語(yǔ)言生存分析: 時(shí)變競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型分析淋巴瘤患者
R語(yǔ)言生存分析可視化分析
R語(yǔ)言中生存分析模型的時(shí)間依賴性ROC曲線可視化
R語(yǔ)言生存分析數(shù)據(jù)分析可視化案例
R語(yǔ)言ggsurvplot繪制生存曲線報(bào)錯(cuò) : object of type ‘symbol‘ is not subsettab
R語(yǔ)言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)
R語(yǔ)言繪制生存曲線估計(jì)|生存分析|如何R作生存曲線圖
R語(yǔ)言解釋生存分析中危險(xiǎn)率和風(fēng)險(xiǎn)率的變化
R語(yǔ)言中的生存分析Survival analysis晚期肺癌患者4例


【視頻】R語(yǔ)言生存分析原理與晚期肺癌患者分析案例|數(shù)據(jù)分享|附代碼數(shù)據(jù)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
安多县| 文登市| 仁寿县| 西吉县| 惠水县| 志丹县| 绥化市| 左权县| 凤庆县| 介休市| 论坛| 亚东县| 临洮县| 东至县| 广河县| 山西省| 碌曲县| 丹凤县| 兴海县| 惠安县| 应城市| 光泽县| 霍邱县| 玛纳斯县| 安平县| 封丘县| 拜泉县| 尤溪县| 界首市| 女性| 平陆县| 临夏县| 临城县| 大同县| 交城县| 小金县| 历史| 海城市| 西乌珠穆沁旗| 崇信县| 松溪县|