cox構(gòu)建預(yù)測模型(3):如何用R語言做cox先單后多回歸分析?。ǜ饺状a)
上一篇為大家介紹了預(yù)測模型中基線表格的繪制方式,那么在預(yù)測模型構(gòu)建過程中,通過Cox回歸來篩選預(yù)測因子也是十分關(guān)鍵的。在影響因素研究中,大家較為熟知的篩選方式是先單后多,但是在預(yù)測模型文章中,更為常用的篩選方法是逐步回歸法。
逐步回歸,是通過逐步將自變量輸入模型,如果模型具統(tǒng)計(jì)學(xué)意義,并將其納入在回歸模型中。同時(shí)移出不具有統(tǒng)計(jì)學(xué)意義的變量。最終得到一個(gè)自動擬合的回歸模型。說到這里大家可能會有點(diǎn)理解了,逐步回歸法的目的是構(gòu)建一個(gè)擬合佳的模型,該變量在回歸過程中是否具有統(tǒng)計(jì)學(xué)意義無關(guān),這與先單后多有著本質(zhì)的區(qū)別。
本文將繼續(xù)以本文將以復(fù)現(xiàn)一篇seer公共數(shù)據(jù)庫文章(Q1 IF=5.2)為例,為大家介紹用R語言進(jìn)行Cox回歸篩選變量的方法,同時(shí),介紹一種更加便捷快速完成統(tǒng)計(jì)分析的“神器”——風(fēng)暴統(tǒng)計(jì)。
主要內(nèi)容包括:
一、文獻(xiàn)解讀
二、利用R語言復(fù)現(xiàn)
三、利用在線網(wǎng)站復(fù)現(xiàn)
四、小結(jié)

一、文獻(xiàn)解讀
案例文獻(xiàn)是沈陽醫(yī)學(xué)院公共衛(wèi)生學(xué)院學(xué)者基于SEER數(shù)據(jù)庫的一項(xiàng)回顧性研究,旨在建立一個(gè)列線圖來預(yù)測老年惡性骨腫瘤(MBT)患者的總生存期(OS)。

1. 摘要
背景:惡性骨腫瘤(MBT)是老年患者死亡的原因之一。我們研究的目的是建立一個(gè)列線圖來預(yù)測老年MBT患者的總生存期(OS)。
方法:從SEER數(shù)據(jù)庫下載了2004年至2018年所有老年MBT患者的臨床病理數(shù)據(jù)。他們被隨機(jī)分配到訓(xùn)練集(70%)和驗(yàn)證集(30%)。采用單因素和多因素Cox回歸分析確定老年MBT患者的獨(dú)立危險(xiǎn)因素。基于這些危險(xiǎn)因素構(gòu)建列線圖,以預(yù)測老年MBT患者的1年,3年和5年OS。然后,利用一致性指數(shù)(C指數(shù))、校準(zhǔn)曲線和受試者工作曲線下面積(AUC)來評價(jià)預(yù)測模型的準(zhǔn)確性和判別力。決策曲線分析(DCA)用于評估列線圖的臨床潛在應(yīng)用價(jià)值。根據(jù)列線圖上的分?jǐn)?shù),將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。Kaplan-Meier(K-M)曲線用于測試兩名患者之間的生存差異。
結(jié)果:從SEER數(shù)據(jù)庫下載了2004年至2018年所有老年MBT患者的臨床病理數(shù)據(jù)。他們被隨機(jī)分配到訓(xùn)練集(70%)和驗(yàn)證集(30%)。采用單因素和多因素Cox回歸分析確定老年MBT患者的獨(dú)立危險(xiǎn)因素?;谶@些危險(xiǎn)因素構(gòu)建列線圖,以預(yù)測老年MBT患者的1年,3年和5年OS。然后,利用一致性指數(shù)(C指數(shù))、校準(zhǔn)曲線和受試者工作曲線下面積(AUC)來評價(jià)預(yù)測模型的準(zhǔn)確性和判別力。決策曲線分析(DCA)用于評估列線圖的臨床潛在應(yīng)用價(jià)值。根據(jù)列線圖上的分?jǐn)?shù),將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。Kaplan-Meier(K-M)曲線用于測試兩名患者之間的生存差異。
結(jié)論:我們建立了一個(gè)新的列線圖來預(yù)測老年MBT患者的1年,3年,5年的OS。該預(yù)測模型可以幫助醫(yī)生和患者制定治療計(jì)劃和后續(xù)策略。
2. 數(shù)據(jù)介紹
文獻(xiàn)共納入1641名2004-2018診斷的老年MBT患者的臨床病理數(shù)據(jù)。暴露因素包括年齡、種族、性別、診斷年份、組織學(xué)類型、分級、分期、原發(fā)位置、TNM分期、腫瘤大小、是否化療、是否放療及手術(shù)方式。

3.研究結(jié)果
篩選預(yù)測因子只用到訓(xùn)練集數(shù)據(jù),通過單因素Cox回歸與多因素Cox回歸篩選預(yù)測變量。這里作者并未使用先單后多或者是逐步回歸法篩選預(yù)測變量,可能從臨床實(shí)際考慮的更多。但在實(shí)操過程中推薦大家優(yōu)先考慮逐步回歸法進(jìn)行篩選,這樣更有利于構(gòu)建一個(gè)擬合效果好的預(yù)測模型。



二、利用R語言復(fù)現(xiàn)
下面我們利用從SEERStat中提取的相關(guān)數(shù)據(jù)進(jìn)行復(fù)現(xiàn)。根據(jù)文獻(xiàn)中的納入排除標(biāo)準(zhǔn),提取涉及的相關(guān)數(shù)據(jù),最終共納入1,574名患者(原文獻(xiàn)1,641)。介于SEERStat數(shù)據(jù)庫會有更新,因此提取的樣本量與原文會有所出入,這里請大家多關(guān)注統(tǒng)計(jì)方法的運(yùn)用!本次用到的是R版本是4.3.1。
?
開始回歸分析前需要做好前期工作:①導(dǎo)入數(shù)據(jù)集;②按照7:3的比例將數(shù)據(jù)集拆分為訓(xùn)練集train和驗(yàn)證集test;③完成均衡性分析。接著再開展今天的回歸分析。(詳見下方鏈接)
如何利用R語言拆分?jǐn)?shù)據(jù)集并做均衡性檢驗(yàn)
1.?安裝加載R包并導(dǎo)入數(shù)據(jù)
這里繪制均衡性表格,主要用到"autoReg"R包,請注意模型變量的篩選是根據(jù)訓(xùn)練集進(jìn)行的,在進(jìn)行數(shù)據(jù)拆分后,需要用訓(xùn)練集來進(jìn)行Cox回歸。
2.?Cox回歸分析
autoReg包是一款功能強(qiáng)大的R包,可以一步到位實(shí)現(xiàn)批量單因素,多因素以及逐步回歸法。可以通過調(diào)整“threshold= ”來改變限制P值的限制。
代碼解讀:autoReg函數(shù)可以自動根據(jù)設(shè)定的閾值控制變量進(jìn)入多因素回歸模型,如果不限制閾值,全部變量進(jìn)入多因素回歸,可將閾值設(shè)置為1,如threshold=1;加上“final= TRUE”表示增加逐步向后回歸的結(jié)果。
R語言結(jié)果如下:


三、利用在線網(wǎng)站復(fù)現(xiàn)
如果沒有代碼基礎(chǔ),或者希望通過更便捷的方式完成統(tǒng)計(jì)分析,推薦使用這個(gè)智能在線統(tǒng)計(jì)分析平臺——風(fēng)暴統(tǒng)計(jì)。一鍵成三線表,便捷又快速。
網(wǎng)址:www.medsta.cn(在電腦端瀏覽器打開)
或medsta.cn(medical statistics縮寫)?
1.進(jìn)入網(wǎng)站分析模塊
電腦端打開風(fēng)暴統(tǒng)計(jì)平臺——“風(fēng)暴智能統(tǒng)計(jì)”模塊,點(diǎn)擊“臨床預(yù)測模型(最新)”,進(jìn)入“cox預(yù)測模型”頁面。

2.完成前期的準(zhǔn)備工作
導(dǎo)入數(shù)據(jù)并根據(jù)需要做好整理轉(zhuǎn)換,將數(shù)據(jù)集拆分為訓(xùn)練集與驗(yàn)證集,做好均衡性分析后,點(diǎn)擊進(jìn)入“Cox構(gòu)建預(yù)測模型”。(詳見下方鏈接)
如何利用R語言拆分?jǐn)?shù)據(jù)集并做均衡性檢驗(yàn)
3.Cox回歸篩選預(yù)測變量
點(diǎn)擊進(jìn)入“Cox預(yù)測模型”模塊,將回歸因變量與回歸自變量分別選入,此外時(shí)間節(jié)點(diǎn)的設(shè)置與研究數(shù)據(jù)相對應(yīng)。
這里要特別注意回歸方法的選擇,如果僅使用先單后多進(jìn)行篩選,則逐步回歸法選擇否,如果選擇開展逐步回歸法,可以通過多因素回歸P值進(jìn)行閾值的設(shè)定,下方的多因素回歸結(jié)果即逐步回歸結(jié)果,可以分別查看單因素、多因素(逐步)或先單后多的結(jié)果,同樣支持導(dǎo)出excel或word三線表結(jié)果。

Word版結(jié)果如下,為了更加清晰的展示HR值與95%置信區(qū)間,下表隱去了β值與SE值,實(shí)際上網(wǎng)站給出的統(tǒng)計(jì)結(jié)果更加全面:




四、小結(jié)
通過對比R語言結(jié)果與風(fēng)暴統(tǒng)計(jì)結(jié)果可以發(fā)現(xiàn),兩者的結(jié)果完全一致,并且風(fēng)暴統(tǒng)計(jì)給出的統(tǒng)計(jì)量更加的全面豐富,且將P值與HR值分為兩列,更加美觀,如果您在實(shí)際中需要用到Cox回歸篩選變量,不妨來風(fēng)暴統(tǒng)計(jì)平臺試一試!
