預(yù)測模型好文學(xué)習(xí)!柳葉刀子刊Lancet Oncol的一篇預(yù)測模型,詳細(xì)解讀

2023年鄭老師多門科研統(tǒng)計課程:多次直播,含孟德爾隨機(jī)化方法? ?

預(yù)測模型好文詳細(xì)解剖
今天給大家介紹的一篇柳葉刀子刊Lancet Oncol發(fā)表的一篇有關(guān)于前列腺癌患者預(yù)后的預(yù)測模型文章。

這篇文章是加州大學(xué)洛杉磯分校研究團(tuán)隊(duì)針對接受?1??Lu-PSMA 治療的轉(zhuǎn)移性去勢抵抗性前列腺癌(簡稱:mCRPC)患者的預(yù)后預(yù)測模型。
文章即有對生存資料結(jié)局(OS和PFS)的預(yù)測,也有對二分類結(jié)局(PSA50)的預(yù)測。所用的預(yù)測模型的方法也中規(guī)中矩,是值得初學(xué)者模仿學(xué)習(xí)。
題外話
介紹文章之前,給大家普及外部驗(yàn)證的知識點(diǎn):
外部驗(yàn)證指的是外部有效性反映了模型的普遍性,需要使用不是來自研究本身的數(shù)據(jù)集進(jìn)行驗(yàn)證,這些數(shù)據(jù)集在時間或地理上是相互獨(dú)立的。
其種類主要分為:
時段驗(yàn)證:指的是利用與模型開發(fā)隊(duì)列來源相同,但是時間段不同的 數(shù)據(jù)對模型表現(xiàn)進(jìn)行驗(yàn)證。
空間驗(yàn)證:指的是 對模型在其他中心甚至其他國家的數(shù)據(jù)中的表現(xiàn) 進(jìn)行驗(yàn)證,所以驗(yàn)證隊(duì)列可能采用與開發(fā)隊(duì)列不 同的納入/排除標(biāo)準(zhǔn)或不同的預(yù)測因子和結(jié)局變 量的測量方法。。
領(lǐng)域驗(yàn)證:是指在不同 的臨床場景中對模型進(jìn)行驗(yàn)證,如開發(fā)用臨床的數(shù)據(jù),驗(yàn)證用社區(qū)的數(shù)據(jù)。
為什么要給大家普及外部驗(yàn)證呢??
還是和這篇文章有關(guān)系。
比較有意思,這篇文章外部驗(yàn)證與模型開發(fā)的同一人群,這和外部驗(yàn)證的概念、作用就沖突了,外部驗(yàn)證的模型的外推性就滿足不了,也失去了外部驗(yàn)證的意義。
接下來給大家介紹一下這篇文章:
文章簡介
目的:本文通過開發(fā)列線圖預(yù)測接受?1??Lu-PSMA 治療mCRPC患者的預(yù)后效果
開發(fā)驗(yàn)證隊(duì)列:數(shù)據(jù)來源于德國、美國、澳大利亞三個國家的6家醫(yī)療和研究中心機(jī)構(gòu)。數(shù)據(jù)按2:1分成開發(fā)隊(duì)列和驗(yàn)證隊(duì)列
研究設(shè)計:國際、多中心、回顧性分析
預(yù)測變量:26個預(yù)測變量進(jìn)行篩選
結(jié)局指標(biāo):主要結(jié)局(OS、PFS),次要結(jié)局(PSA50:前列腺特異性抗原下降50%以上)
模型開發(fā):OS結(jié)局利用診斷時間,化療狀況等7個變量構(gòu)建列線圖;PFS結(jié)局利用平均標(biāo)準(zhǔn)攝取值等6個變量構(gòu)建列線圖;PSA50結(jié)局利用有無肝轉(zhuǎn)移等4個變量構(gòu)建列線圖
模型評價:C指數(shù)及95%CI,校準(zhǔn)圖
模型驗(yàn)證:內(nèi)部驗(yàn)證(bootstrap法)和外部驗(yàn)證計算C指數(shù)和校準(zhǔn)圖
結(jié)果簡介:270名患者分為開發(fā)隊(duì)列(196人)和驗(yàn)證隊(duì)列(74人),中位生存時間為21.5(13.3-30.7)月。
OS結(jié)局開發(fā)模型C指數(shù)為0.71(95% CI 0.69–0.73),內(nèi)部驗(yàn)證和外部隊(duì)列C指數(shù)與開發(fā)模型相似,分別為0.71(95% CI 0.69–0.73),0.72(95% CI 0.68–0.76)。

PFS結(jié)局開發(fā)模型C指數(shù)為?0.70 (95% CI 0.68–0.72),內(nèi)部驗(yàn)證和外部隊(duì)列C指數(shù)與開發(fā)模型相似,分別為0.70 (0·68–0·72),0.71 (0.68–0.74)。

所有模型的校準(zhǔn)度都較高,總體而言,這個模型不管是開發(fā)還是驗(yàn)證,效果還是比較好的

根據(jù)開發(fā)模型的最佳截斷值,將病人劃分為低風(fēng)險及高風(fēng)險,結(jié)果發(fā)現(xiàn),在開發(fā)隊(duì)列、驗(yàn)證隊(duì)列、全數(shù)據(jù)集中低風(fēng)險病人較高風(fēng)險病有有較長的生存時間:os中位生存時間:驗(yàn)證隊(duì)列低風(fēng)險24.9(95%CI 16.8-27.3)月 VS 高風(fēng)險 7.4(95%CI 4.0-10.8)月

PFS中位生存時間:驗(yàn)證隊(duì)列低風(fēng)險6.6(95%CI 6.0-7.1)月?VS?高風(fēng)險 2.5(95%CI?1.2-3.8)月

以下就是這篇文章詳細(xì)的介紹:
研究背景
研究表明在mCRPC患者接受?1??Lu-PSMA 治療給予標(biāo)準(zhǔn)化護(hù)理以提高OS和PFS。因此需要探索接受?1??Lu-PSMA 治療后mCRPC患者的預(yù)測因子,以支持1??Lu-PSMA的實(shí)施及下一代1??Lu-PSMA試驗(yàn)設(shè)計的開展。作者主要是開發(fā)列線圖預(yù)測接受?1??Lu-PSMA 治療mCRPC患者的預(yù)后效果。作者認(rèn)為結(jié)合造影數(shù)據(jù)和臨床特征數(shù)據(jù)可以提高選擇新療法的證據(jù)和臨床決策,并為后續(xù)的臨床試驗(yàn)的實(shí)施提供思路。
研究方法
研究人群:介紹了人群的來源,三個國家,6個醫(yī)療及科研機(jī)構(gòu)。同時也詳細(xì)介紹了病人納入的標(biāo)準(zhǔn),在這也估人群研究時要明確的人群來源。

數(shù)據(jù)的收集及變量的選擇:這一塊作者人群分成了兩塊,開發(fā)隊(duì)列和驗(yàn)證隊(duì)列,而且還平衡了兩個隊(duì)列在各機(jī)構(gòu)的研究數(shù)量,強(qiáng)調(diào)這兩個隊(duì)列是同一人群(這種操作是比較少見的)。另外還介紹了預(yù)測變量及檢測方法,共收集了26個變量(變量多,樣本少所以作者用lasso回歸進(jìn)行樣本量的篩選)

樣本量的問題:能得到多少樣本量就用多少樣本量,預(yù)測模型文章也沒少這么描述。而且作者也任性,檢驗(yàn)效能也沒有事先計算。

模型的建立與驗(yàn)證:作者建立多個列線圖,也就是多個模型(OS兩個模型,PFS兩個模型,PSA50一個模型)。每個模型建立的步驟基本上相同,先通過Lasso回歸篩選變量,然后再通過Cox等比例風(fēng)險模型,logistic回歸建立模型(PSA50的方法和結(jié)果都在附件中呈現(xiàn))。

模型評價用兩個方法:區(qū)分度和校準(zhǔn)度,區(qū)分度用C指數(shù)及95%可信區(qū)間,校準(zhǔn)度用校準(zhǔn)圖表示。(在這里大家就可以看到用了幾個模型)


另外作者還利用開發(fā)的模型確定最優(yōu)截斷值,并根據(jù)最優(yōu)截斷值將患者分成了高風(fēng)險和低風(fēng)險,還對這兩類人群的生存狀況進(jìn)行了分析。


詳情請點(diǎn)擊下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650406989&idx=1&sn=3a5b26e9832293978c2e91e4a32b1ec5&chksm=83527de5b425f4f35e3b00675baafaf44d7a525f364b470e3f347bc06f4f08c39f94bad8ce4b&token=1613624025&lang=zh_CN#rd
