最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網 會員登陸 & 注冊

如何快速構建預測模型:Cox法(2)

2023-08-27 16:58 作者:風暴統(tǒng)計  | 我要投稿

上一篇為大家介紹了預測模型中基線表格的繪制方式,那么在預測模型構建過程中,通過Cox回歸來篩選預測因子也是十分關鍵的。在影響因素研究中,大家較為熟知的篩選方式是先單后多,但是在預測模型文章中,更為常用的篩選方法是逐步回歸法。


逐步回歸,是通過逐步將自變量輸入模型,如果模型具統(tǒng)計學意義,并將其納入在回歸模型中。同時移出不具有統(tǒng)計學意義的變量。最終得到一個自動擬合的回歸模型。說到這里大家可能會有點理解了,逐步回歸法的目的是構建一個擬合佳的模型,該變量在回歸過程中是否具有統(tǒng)計學意義無關,這與先單后多有著本質的區(qū)別。


本文將繼續(xù)以本文將以復現一篇seer公共數據庫文章(Q1 IF=5.2)為例,為大家介紹用R語言進行Cox回歸篩選變量的方法,同時,介紹一種更加便捷快速完成統(tǒng)計分析的“神器”——風暴統(tǒng)計


風暴統(tǒng)計


主要內容包括:

一、文獻解讀

二、利用R語言復現

三、利用在線網站復現

四、小結



一、文獻解讀


案例文獻是沈陽醫(yī)學院公共衛(wèi)生學院學者基于SEER數據庫的一項回顧性研究,旨在建立一個列線圖來預測老年惡性骨腫瘤(MBT)患者的總生存期(OS)。?

案例文獻

1. 摘要


背景:惡性骨腫瘤(MBT)是老年患者死亡的原因之一。我們研究的目的是建立一個列線圖來預測老年MBT患者的總生存期(OS)。


方法:從SEER數據庫下載了2004年至2018年所有老年MBT患者的臨床病理數據。他們被隨機分配到訓練集(70%)和驗證集(30%)。采用單因素和多因素Cox回歸分析確定老年MBT患者的獨立危險因素?;谶@些危險因素構建列線圖,以預測老年MBT患者的1年,3年和5年OS。然后,利用一致性指數(C指數)、校準曲線和受試者工作曲線下面積(AUC)來評價預測模型的準確性和判別力。決策曲線分析(DCA)用于評估列線圖的臨床潛在應用價值。根據列線圖上的分數,將患者分為高風險組和低風險組。Kaplan-Meier(K-M)曲線用于測試兩名患者之間的生存差異。


結果:從SEER數據庫下載了2004年至2018年所有老年MBT患者的臨床病理數據。他們被隨機分配到訓練集(70%)和驗證集(30%)。采用單因素和多因素Cox回歸分析確定老年MBT患者的獨立危險因素?;谶@些危險因素構建列線圖,以預測老年MBT患者的1年,3年和5年OS。然后,利用一致性指數(C指數)、校準曲線和受試者工作曲線下面積(AUC)來評價預測模型的準確性和判別力。決策曲線分析(DCA)用于評估列線圖的臨床潛在應用價值。根據列線圖上的分數,將患者分為高風險組和低風險組。Kaplan-Meier(K-M)曲線用于測試兩名患者之間的生存差異。


結論:我們建立了一個新的列線圖來預測老年MBT患者的1年,3年,5年的OS。該預測模型可以幫助醫(yī)生和患者制定治療計劃和后續(xù)策略。


2. 數據介紹

文獻共納入1641名2004-2018診斷的老年MBT患者的臨床病理數據。暴露因素包括年齡、種族、性別、診斷年份、組織學類型、分級、分期、原發(fā)位置、TNM分期、腫瘤大小、是否化療、是否放療及手術方式。

變量說明

3.研究結果


篩選預測因子只用到訓練集數據,通過單因素Cox回歸與多因素Cox回歸篩選預測變量。這里作者并未使用先單后多或者是逐步回歸法篩選預測變量,可能從臨床實際考慮的更多。但在實操過程中推薦大家優(yōu)先考慮逐步回歸法進行篩選,這樣更有利于構建一個擬合效果好的預測模型。


二、利用R語言復現


下面我們利用從SEERStat中提取的相關數據進行復現。根據文獻中的納入排除標準,提取涉及的相關數據,最終共納入1,574名患者(原文獻1,641)。介于SEERStat數據庫會有更新,因此提取的樣本量與原文會有所出入,這里請大家多關注統(tǒng)計方法的運用!本次用到的是R版本是4.3.1。

?

開始回歸分析前需要做好前期工作:①導入數據集;②按照7:3的比例將數據集拆分為訓練集train和驗證集test;③完成均衡性分析。接著再開展今天的回歸分析。

如何快速構建預測模型:Cox法(1)


1.?安裝加載R包并導入數據

這里繪制均衡性表格,主要用到"autoReg"R包,請注意模型變量的篩選是根據訓練集進行的,在進行數據拆分后,需要用訓練集來進行Cox回歸。


2.?Cox回歸分析

autoReg包是一款功能強大的R包,可以一步到位實現批量單因素,多因素以及逐步回歸法??梢酝ㄟ^調整“threshold= ”來改變限制P值的限制。


代碼解讀:autoReg函數可以自動根據設定的閾值控制變量進入多因素回歸模型,如果不限制閾值,全部變量進入多因素回歸,可將閾值設置為1,如threshold=1;加上“final= TRUE”表示增加逐步向后回歸的結果。



三、利用在線網站復現


如果沒有代碼基礎,或者希望通過更便捷的方式完成統(tǒng)計分析,推薦使用這個智能在線統(tǒng)計分析平臺——風暴統(tǒng)計。一鍵成三線表,便捷又快速。

它的網址是www.medsta.cn(在電腦端瀏覽器打開)

瀏覽器輸入medsta.cn即可medical?statistics縮寫)

?

1.進入網站分析模塊

電腦端打開風暴統(tǒng)計平臺——“風暴智能統(tǒng)計”模塊,點擊“臨床預測模型(最新)”,進入“cox預測模型”頁面。


2.完成前期的準備工作


導入數據并根據需要做好整理轉換,將數據集拆分為訓練集與驗證集,做好均衡性分析后,點擊進入“Cox構建預測模型”。

?

3.Cox回歸篩選預測變量


點擊進入“Cox預測模型”模塊,將回歸因變量與回歸自變量分別選入,此外時間節(jié)點的設置與研究數據相對應。


這里要特別注意回歸方法的選擇,如果僅使用先單后多進行篩選,則逐步回歸法選擇否,如果選擇開展逐步回歸法,可以通過多因素回歸P值進行閾值的設定,下方的多因素回歸結果即逐步回歸結果,可以分別查看單因素、多因素(逐步)或先單后多的結果,同樣支持導出excel或word三線表結果。


Word版結果如下,為了更加清晰的展示HR值與95%置信區(qū)間,下表隱去了β值與SE值,實際上網站給出的統(tǒng)計結果更加全面:


四、小結


通過對比R語言結果與風暴統(tǒng)計結果可以發(fā)現,兩者的結果完全一致,并且風暴統(tǒng)計給出的統(tǒng)計量更加的全面豐富,且將P值與HR值分為兩列,更加美觀,如果您在實際中需要用到Cox回歸篩選變量,不妨來風暴統(tǒng)計平臺試一試!


如何快速構建預測模型:Cox法(2)的評論 (共 條)

分享到微博請遵守國家法律
饶河县| 铅山县| 丹寨县| 政和县| 郧西县| 长子县| 民乐县| 偃师市| 元谋县| 陇川县| 江西省| 温宿县| 象州县| 剑河县| 新乡市| 黄石市| 内黄县| 东乡| 宁远县| 渭源县| 林口县| 额尔古纳市| 南雄市| 年辖:市辖区| 湘乡市| 朝阳县| 天全县| 绥阳县| 连南| 当雄县| 潮州市| 新闻| 黄大仙区| 黎城县| 保亭| 金门县| 德格县| 延川县| 洪雅县| 新乡县| 广东省|