ROC曲線案例分析
一、案例介紹
研究者想要進(jìn)行“糖化血蛋白”的研究,對糖尿病患者和非糖尿病患者各100名檢測糖化血紅蛋白(HbAlc)含量,希望可以研究糖化血蛋白對患有糖尿病的情況是否有診斷價值,如果有最佳的診斷界值是多少。
二、問題分析
想要研究糖化血蛋白對患有糖尿病的情況是否有診斷價值,“是否患有糖尿病”為定類變量,糖化血蛋白是定量變量,可以進(jìn)行構(gòu)造ROC曲線。進(jìn)而判斷糖化血蛋白指標(biāo)對患者的診斷價值然后進(jìn)行查看最佳的診斷界值。
三、軟件操作及結(jié)果解讀
(一) 數(shù)據(jù)導(dǎo)入
1.數(shù)據(jù)格式
首先將數(shù)據(jù)整理成正確的格式,一般一個X為一列,Y為一例,并且分析的數(shù)據(jù)帶有數(shù)據(jù)標(biāo)簽的,需要另添加一個表格進(jìn)行說明,數(shù)據(jù)格式如下(特別說明:SPSSAU默認(rèn)的切割點(diǎn)為1):
2.導(dǎo)入數(shù)據(jù)
將整理好的數(shù)據(jù)上傳至SPSSAU系統(tǒng)內(nèi),如下:
上傳的數(shù)據(jù)如下:
(二)ROC曲線分析
1. 軟件操作
ROC曲線分析路徑為點(diǎn)擊【可視化】→【ROC曲線】然后進(jìn)行分析:
2. 結(jié)果解讀
SPSSAU默認(rèn)以1作為切割點(diǎn),即1作為陽性,其它作為陰性,首先查看下數(shù)據(jù)的分布,如下:
發(fā)現(xiàn)數(shù)據(jù)中陰性和陽性各占一半,數(shù)據(jù)分布均勻。
診斷價值判斷:
一般診斷價值判斷可以根據(jù)AUC指標(biāo),判斷如下:
從結(jié)果可以看出血紅蛋白含量對應(yīng)的AUC值為0.944,大于0.9,所以說明診斷價值高,并且從p值也能看出,p值小于0.05,說明血紅蛋白含量對應(yīng)的AUC值明顯高于0.5。接下來進(jìn)行查看最佳界值。
最佳界值結(jié)果:
最佳界值結(jié)果如上,最佳界值即ROC曲線最靠近左上角的點(diǎn),也即說明敏感度和誤報率(1-特異性)組合的相對優(yōu)值。(其中,敏感度一般為陽性群體中檢測出陽性的概率,誤報率是指陰性的群體中檢測出陽性的概率)。從表格中可以得到,當(dāng)敏感度為0.910時,特異度為0.880(1-特異性為0.12)時,最靠近左上角,cut-off值是指某分析項在此界值(cut-off值)時可得到最大的尤登指數(shù)。比如X為6時,得到最佳界值,同時也可以觀察ROC曲線:
四、結(jié)論
想要研究糖化血蛋白對患有糖尿病的情況是否有診斷價值,通過SPSSAU利用ROC曲線進(jìn)行分析,最后發(fā)現(xiàn)血紅蛋白含量對應(yīng)的AUC值為0.944,大于0.9,說明診斷價值高,當(dāng)敏感度為0.910時,特異度為0.880(1-特異性為0.12)時,最靠近左上角,最佳界值為0.790。
五、知識小貼士
1、AUC小于0.5
針對出現(xiàn)AUC小于0.5時,通常原因在于“陽性”和“陰性”的區(qū)分有問題,SPSSAU以等于切割點(diǎn)作為“陽性”,不等于切割點(diǎn)作為“陰性”,默認(rèn)切割點(diǎn)為數(shù)字1。請確認(rèn)設(shè)置是否有問題,如果“陽性”或“陰性”設(shè)置有誤,可重新設(shè)置,或者重新上傳正確的數(shù)據(jù)。
2、數(shù)據(jù)類型
針對ROC曲線的X(檢驗(yàn)變量)和Y(狀態(tài)變量)的進(jìn)一步說明,X(檢驗(yàn)變量)和Y(狀態(tài)變量)可為任意數(shù)據(jù)類型(定量和定類數(shù)據(jù)均可);有以下兩點(diǎn)需要特別提示:
參考文獻(xiàn):
[1]孫振球.醫(yī)學(xué)統(tǒng)計學(xué).第3版[M].人民衛(wèi)生出版社,2010.