SPSS生存分析關(guān)鍵概念與計(jì)算
SPSS生存分析關(guān)鍵概念與計(jì)算 課程首發(fā)于微信公眾號——211統(tǒng)計(jì)課堂,歡迎大家關(guān)注 如需要加入SCI,CSCD論文、課題等科研數(shù)據(jù)統(tǒng)計(jì)分析交流群,請加小編微信:“?Stat211”,小編拉您進(jìn)群 ? 本推文是SPSS‖生存分析基礎(chǔ)入門與實(shí)戰(zhàn)課程中S02-1生存分析 ? 首先總結(jié)下死亡速度、生存率、和生存時間。 死亡速度及其計(jì)算 “死亡”指的是,陽性終點(diǎn)事件的發(fā)生。死亡速度:時刻存活的個體在t時刻的瞬時死亡(陽性事件發(fā)生)率,可以理解為一-組人群在不同時刻的陽性終點(diǎn)事件發(fā)生的速度。具體可以用以下函數(shù)來表達(dá):
? 在專業(yè)上,我們把它稱之為風(fēng)險(xiǎn)h(t), 上述公式稱之為風(fēng)險(xiǎn)函數(shù)(hazard function) 。風(fēng)險(xiǎn)函數(shù)隨著時間的變化而變化,一般情況下,隨訪前期,“死亡速度較快。 與死亡速度相對應(yīng)的的是死亡率,即一段時間內(nèi)人群的死亡比例,死亡率由死亡速度乘以時間即可得到。 生存率及其計(jì)算 生存率(survival rate):0 時刻存活的個體經(jīng)歷 t 時后仍存活的可能性,簡寫為S(t)。這一指標(biāo)臨床上用的非常多,比如我們經(jīng)常計(jì)算肺癌患者3年生存率、10年生存率、乳腺癌患者5年復(fù)發(fā)率等。 一把情況下,研究伊始人群總生存率為1,而當(dāng)所有人出現(xiàn)陽性終點(diǎn)事件時,生存率為0。 生存率與時間相關(guān),可建立與時間的函數(shù)關(guān)系,因此生存率又稱關(guān)于時間的生存函數(shù)。一般情況下,由于生存分析主要陽性事件結(jié)局為壞結(jié)局,時間越長,生存率往往越低。 研究者可以根據(jù)研究對象的“死亡”速度,來計(jì)算各時間點(diǎn)的生存率。最常見的計(jì)算方法是Kaplan-Meier法。Kaplan-Meier法又稱乘積極限法,它根據(jù)每一個時間段的生存概率相乘得到累計(jì)生存率。初學(xué)者可忽略其計(jì)算的原理與方法。 生存時間及其計(jì)算 生存時間與死亡率、生存率緊密相關(guān)。死亡速度越高、生存率越低,則生存時間越短。生存時間的計(jì)算,最常見的采用中位生存時間來描述。中位生存時間(median survival time):也稱半數(shù)生存期,是生存時間中位數(shù),表示恰有50%的個體存活的時間,即生存率為50%時對應(yīng)的生存時間,是描述集中趨勢的指標(biāo)。中位生存期越長,表示疾病的預(yù)后越好。 如何閱讀生存曲線圖 死亡速度、生存率、生存時間三者一事三表,高度相關(guān)(見下圖)。
? 生存曲線圖可集中形象反映三者的特征與關(guān)系。 ? 生存曲線圖最常見的莫過于Kaplan-Meier生存曲線圖。1958年,Edward L. Kaplan和 Paul Meier合作發(fā)表了一篇關(guān)于如何處理不完整的生存時間資料文章后,利用Kaplan-Meier方法描繪生存過程、繪制生存曲線已經(jīng)成為處理不同生存時間(time-to-event)的最熟悉的方式。 我們以下數(shù)據(jù)為例,采用SPSS軟件繪制出最樸素的生存曲線圖。 3種療法治療66例白血病患者緩解時間(天),數(shù)據(jù)(kaplanm.sav)如下: A療法:4,5,9,10,11,12,13,20+,28,28,28,29,31,32,37,41,41,57,62,74,109,100,139,158+ B療法:8,10,10,12,14,20,48,70,75,99,103,161+,162,169,195,199+,220,217+,245+ C療法:8,10,11,12+,23,25,28,28,31,31,40,48,89,124,143,159+,190+,196+,197+,205+,219+ 本案例中總共有3種療法,每種療法的終點(diǎn)陽性事件是疾病進(jìn)展,生存時間即術(shù)后到疾病進(jìn)展之間的緩解期時間。時間帶+號意味著它是不完全生存時間,研究對象刪失了。 隨著時間的流逝,同一療法的患者逐漸出現(xiàn)疾病進(jìn)展的現(xiàn)象,且大部分出現(xiàn)在早期,所以早期生存率下降地較快(風(fēng)險(xiǎn)函數(shù)值即死亡速度較大)。不同人群的同一時期的死亡速度可能不一致,導(dǎo)致不同對象死亡率、中位生存時間都不一致。 下圖即Kaplan-Meier 生存曲線圖,我們可以從中得到更多的信息。該圖X軸為生存時間,Y軸為生存率,不同曲線代表不同治療隨著時間變化,生存率發(fā)生的變化。請問,三種治療方法生存率變化趨勢一致嗎?死亡速度變化一致嗎?
? 很明顯,三者死亡率均呈下降趨勢,早期下降較快,后期趨于平穩(wěn);三者死亡率下降速度不一致,A療法(代表藍(lán)色曲線)生存率下降較快,死亡速度較快,因此生存時間也相對較短。B、C兩種療法伯仲之間。 曲線圖折線的發(fā)生意味著此時此刻研究對象發(fā)生陽性事件(本例是患者出現(xiàn)了進(jìn)展);帶加號意味著,在此時此刻,患者出現(xiàn)了失訪現(xiàn)象。該時刻出現(xiàn)陽性事件該時刻患者刪失了 Y軸50%生存率對應(yīng)的X軸時間為各條曲線的中位生存時間??梢钥闯鰜?,時間長短上,A療法
? 怎么看死亡速度(風(fēng)險(xiǎn)函數(shù)值)呢?某一時刻的死亡速度即該時刻的曲線的切線斜率(紫色虛線)??梢钥闯觯诘?0天前后,三者切線斜率是A療法>B療法>C療法,意味著A療法出現(xiàn)疾病進(jìn)展的速度最快。同時,不同時刻同一人群死亡速度不同
? 因此,通過K-M生存曲線圖就可大致描述不同組人群的生存率、死亡速度、中位生存時間。同時,生存曲線圖也顯示出3組人群生存率變化趨勢不盡相同,或者說3條生存曲線不一致,反映出3組人群不同的生存狀態(tài)。 ?