Logistic構(gòu)建預(yù)測(cè)模型(8):如何用R語(yǔ)言繪制DCA曲線?(附全套代碼)
Logistic構(gòu)建臨床預(yù)測(cè)模型系列主要以一篇基于logistic回歸構(gòu)建預(yù)測(cè)模型的文章為例,從整理數(shù)據(jù)到構(gòu)建預(yù)測(cè)模型,再到內(nèi)部驗(yàn)證模型,包括了整理數(shù)據(jù)、隨機(jī)數(shù)據(jù)拆分、基線描述、差異性分析、繪制ROC曲線并計(jì)算AUC值、HL檢驗(yàn)及繪制校準(zhǔn)曲線、構(gòu)建列線圖模型并繪制DCA曲線,基本涵蓋了Logistic構(gòu)建預(yù)測(cè)模型的全過(guò)程,敬請(qǐng)期待!
決策曲線分析(DCA)是一種評(píng)估預(yù)測(cè)模型和診斷測(cè)試的方法,是個(gè)與ROC曲線相提并論的相對(duì)比較新的模型評(píng)價(jià)方法。
本文屬于Logistic構(gòu)建臨床預(yù)測(cè)模型系列文章第八篇,分別用R語(yǔ)言和風(fēng)暴統(tǒng)計(jì)對(duì)Logistic預(yù)測(cè)模型DCA曲線的繪制進(jìn)行復(fù)現(xiàn)。系列文章詳情請(qǐng)點(diǎn)擊下方鏈接:
Logistic構(gòu)建預(yù)測(cè)模型(1):復(fù)現(xiàn)SEER數(shù)據(jù)庫(kù)文獻(xiàn)解讀
Logistic構(gòu)建預(yù)測(cè)模型(2):如何用R語(yǔ)言整理數(shù)據(jù)?(附全套代碼)
Logistic構(gòu)建預(yù)測(cè)模型(3):如何用R語(yǔ)言拆分?jǐn)?shù)據(jù)集并做均衡性檢驗(yàn)?(附全套代碼)
Logistic構(gòu)建預(yù)測(cè)模型(4):如何用R語(yǔ)言做Logistic先單后多回歸分析?。ǜ饺状a)
Logistic構(gòu)建預(yù)測(cè)模型(5):如何用R語(yǔ)言繪制精美的ROC曲線?(附全套代碼)
Logistic構(gòu)建預(yù)測(cè)模型(6):如何用R語(yǔ)言繪制校準(zhǔn)曲線并做H-L檢驗(yàn)?(附全套代碼)
Logistic構(gòu)建預(yù)測(cè)模型(7):如何用R語(yǔ)言繪制Logistic預(yù)測(cè)模型列線圖?(附全套代碼)
今日文章分為三部分
1.文章解讀
2.R語(yǔ)言復(fù)現(xiàn)
3.小白簡(jiǎn)易版DCA曲線繪制

1.文章解讀
案例文獻(xiàn)是一篇基于SEER公共數(shù)據(jù)庫(kù)的一項(xiàng)回顧性研究,旨在開(kāi)發(fā)和驗(yàn)證列線圖以預(yù)測(cè)腦轉(zhuǎn)移的非小細(xì)胞肺癌患者早期死亡。

背景:在非小細(xì)胞肺癌(NSCLC)的整個(gè)病程中,很多患者會(huì)出現(xiàn)預(yù)后差、死亡率高的腦轉(zhuǎn)移(BM)。然而,很少有模型能預(yù)測(cè)有腦轉(zhuǎn)移的NSCLC患者的早期死亡(ED)。我們旨在開(kāi)發(fā)列線圖來(lái)預(yù)測(cè)NSCLC腦轉(zhuǎn)移患者ED。
方法:從監(jiān)測(cè)、流行病學(xué)和最終結(jié)果(SEER)數(shù)據(jù)庫(kù)中選取了2010年至2015年間患有BM的NSCLC患者。納入標(biāo)準(zhǔn)如下:(I)患者經(jīng)病理診斷為NSCLC;(II)患者患有BM。患者按7:3的比例隨機(jī)分為兩組,分別為訓(xùn)練組和驗(yàn)證組。采用單因素和多因素Logistic回歸方法來(lái)確定伴有BM的NSCLC患者發(fā)生ED的危險(xiǎn)因素。建立了兩個(gè)列線圖,并通過(guò)校準(zhǔn)曲線、ROC曲線和決策曲線分析(DCA)進(jìn)行了驗(yàn)證。隨訪數(shù)據(jù)包括生存月數(shù)、死因和生命狀態(tài)。初次診斷后3個(gè)月內(nèi)的死亡定義為ED,終點(diǎn)為全因ED和癌癥特異性ED。
結(jié)果:共納入了4,920名患有BM的NSCLC患者,并隨機(jī)分為兩個(gè)隊(duì)列(7:3),包括訓(xùn)練隊(duì)列(n=3,444)和驗(yàn)證隊(duì)列(n=1,476)。全因ED和癌癥特異性ED的獨(dú)立預(yù)后因素包括年齡、性別、種族、腫瘤大小、組織學(xué)、T分期、N分期、分級(jí)、手術(shù)、放療、化療、骨轉(zhuǎn)移和肝轉(zhuǎn)移。所有這些變量都用于建立列線圖。在全因ED和癌癥特異性ED的列線圖中,訓(xùn)練數(shù)據(jù)集的ROC曲線下面積分別為0.813(95% CI:0.799-0.837)和0.808(95% CI:0.791-0.830),驗(yàn)證數(shù)據(jù)集的ROC曲線下面積分別為0.835(95% CI:0.805-0.862)和0.824(95% CI:0.790-0.849)。此外,校準(zhǔn)曲線證明預(yù)測(cè)的ED與實(shí)際值一致。DCA臨床應(yīng)用前景良好。
結(jié)論:列線圖可用來(lái)預(yù)測(cè)患者死亡的具體概率,有助于治療決策和重點(diǎn)護(hù)理,以及醫(yī)患溝通。?
本文構(gòu)建logistic預(yù)測(cè)模型并做內(nèi)部驗(yàn)證,思路框架清晰,案例十分典型。先拆分?jǐn)?shù)據(jù)集為訓(xùn)練集和驗(yàn)證集,比例為7:3,驗(yàn)證集用于進(jìn)行內(nèi)部驗(yàn)證。然后做基線描述,比較訓(xùn)練集和驗(yàn)證集的基線差異性,再做單因素和多因素logistic回歸,將單因素P值小于0.05的因素納入到多因素回歸模型中。再根據(jù)多因素回歸的結(jié)果構(gòu)建列線圖預(yù)測(cè)模型,并對(duì)模型進(jìn)行驗(yàn)證,繪制ROC、校準(zhǔn)曲線及DCA曲線,模型比較穩(wěn)定。
今天我們對(duì)本文的DCA曲線繪制展開(kāi)復(fù)現(xiàn)。DCA的結(jié)果表明列線圖模型具有良好的臨床實(shí)用性。

2.R語(yǔ)言復(fù)現(xiàn)
2.1安裝和加載R包
2.2繪制DCA曲線

3.小白簡(jiǎn)易版DCA曲線繪制
用它,小白也能輕松繪制DCA曲線,還能直接美化調(diào)整,不是吹的,看過(guò)就知道它有多好用?。?/p>
3.1電腦端打開(kāi)風(fēng)暴統(tǒng)計(jì)平臺(tái)——“風(fēng)暴智能統(tǒng)計(jì)”模塊,點(diǎn)擊“臨床預(yù)測(cè)模型(最新)”,進(jìn)入“臨床預(yù)測(cè)模型:內(nèi)部驗(yàn)證”頁(yè)面。

3.2導(dǎo)入數(shù)據(jù)集total

3.3拆分?jǐn)?shù)據(jù)集,設(shè)置隨機(jī)數(shù)字并確定拆分比例

3.4開(kāi)展logistic回歸分析

3.5結(jié)果直出?;貧w變量和多因素回歸設(shè)置完成后,下方結(jié)果直接給出,如下圖所示,快的讓人震驚!??!

DCA圖顯示設(shè)置直接小白式操作也可以畫出精美曲線,太牛了!

訓(xùn)練集和驗(yàn)證集DCA曲線直接給出,可以下載為高清圖片

諸位快來(lái)一試!