數(shù)理統(tǒng)計(jì)分析策略-SPSS
? ? 數(shù)理統(tǒng)計(jì)分析策略主要分為統(tǒng)計(jì)分析方法和統(tǒng)計(jì)分析策略,本文中軟件一般指SPSS。
? ? 統(tǒng)計(jì)分析方法:簡(jiǎn)單、復(fù)雜關(guān)聯(lián)性研究。
? ? 簡(jiǎn)單關(guān)聯(lián)性研究分為差異性分析和相關(guān)性分析(直線相關(guān)分析和秩相關(guān)分析)。
? ? 差異性分析:定量數(shù)據(jù)和分類(lèi)數(shù)據(jù)(定性數(shù)據(jù))。
? ? **編者注:在經(jīng)典的線性回歸模型中,方差齊性是進(jìn)行回歸的前提要素之一,因OLS(最小二乘法)回歸式要求模型中的隨機(jī)誤差項(xiàng)在解釋變量時(shí)具有相同的方差[1]。
? ? 定量數(shù)據(jù)如果只有兩組,可以根據(jù)其是否通過(guò)正態(tài)性分布檢驗(yàn)(SPSS正態(tài)性檢驗(yàn),合理設(shè)置因子、因變量和標(biāo)注個(gè)案,Kolmogorov-Smirnov和Shapiro-Wilk,采用Lilliefors顯著水平修正,若正態(tài)性檢驗(yàn)未通過(guò),也可以繪制Q-Q圖[2]對(duì)正態(tài)性進(jìn)行進(jìn)一步的探究,有些數(shù)據(jù)僅略顯偏態(tài))和方差齊性檢驗(yàn)[3](Levene(萊文)檢驗(yàn)與單因素ANOVA分析)判斷使用何種方法進(jìn)行檢驗(yàn)。
? ? 值得注意的是,方差齊性檢驗(yàn)一般與t檢驗(yàn)結(jié)果一同產(chǎn)生。
? ? 如果定量數(shù)據(jù)的數(shù)量只有兩組,根據(jù)是否正態(tài)、方差齊,符合則使用t檢驗(yàn),不符合則使用秩和檢驗(yàn)(Mann whitney / u / z 檢驗(yàn))。
? ? 若是多組定量數(shù)據(jù),可以進(jìn)行方差分析(成組F分析),此方法需要兩組及以上定量數(shù)據(jù),且需要通過(guò)正態(tài)性檢驗(yàn);也可以進(jìn)行多樣本非參數(shù)秩和檢驗(yàn)(Kruskal Wallis秩和檢驗(yàn) / H檢驗(yàn)),此種方法同樣需要通過(guò)正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn);也可以通過(guò)多重比較來(lái)比較各組均數(shù)是否相等。
? ? 分類(lèi)數(shù)據(jù)同樣分為兩組和多組兩種情況。
? ? 兩組分類(lèi)數(shù)據(jù)可以進(jìn)行秩和檢驗(yàn)、卡方檢驗(yàn)(N≥40,T≥5則為卡方檢驗(yàn);N≥40,至少一個(gè)1≤T<5則為矯正卡方檢驗(yàn),此方法檢驗(yàn)是否構(gòu)成比的分布)、Fisher確切概率法(超過(guò)20%的T<5或至少一個(gè)T<1)[4]。
? ? 多組分類(lèi)數(shù)據(jù)同樣可以采用上段介紹的三種統(tǒng)計(jì)分析方法,這里再進(jìn)行一些補(bǔ)充,秩和檢驗(yàn)討論的是分布位置差異性,比較的是平均值[5];卡方檢驗(yàn)不超過(guò)20%的T<5,討論的是構(gòu)成分布,即分布輪廓的差異性。
? ? 以上均為簡(jiǎn)單關(guān)聯(lián)性研究的內(nèi)容,下面是復(fù)雜關(guān)聯(lián)性研究的方法:
? ? 復(fù)雜關(guān)聯(lián)性研究可以分為單因素回歸分析和多因素回歸分析,對(duì)此分類(lèi),可以分為線性回歸、logistic分析和cox比例風(fēng)險(xiǎn)回歸。
? ? 線性回歸需要滿(mǎn)足的前提條件是自變量和因變量(在此處用x、y表示)理論上存在因果關(guān)系,有定量資料,且x、y具有線性關(guān)系(SPSS中通常通過(guò)繪制散點(diǎn)圖的形式加以證明)。具體條件分為line(x、y具有線性關(guān)系)、independence(任意兩個(gè)殘差相互獨(dú)立)、normal(殘差服從正態(tài)分布,即通過(guò)正態(tài)性檢驗(yàn))、equal(殘差通過(guò)方差齊性檢驗(yàn))。
? ? Logistic分析主要用于分類(lèi)資料,cox比例風(fēng)險(xiǎn)回歸用于生存分析比較。

? ? 統(tǒng)計(jì)分析策略分為RCT研究、觀察性研究和生存分析。
? ? RCT研究描述的是均數(shù) ± 標(biāo)準(zhǔn)差 / 中位數(shù)和四分位數(shù)間距,使用簡(jiǎn)單關(guān)聯(lián)性方法即可進(jìn)行基線差異性分析、差值分析等。
? ? 觀察性研究根據(jù)研究影響因素和控制混雜偏倚進(jìn)行分類(lèi)。
? ? 根據(jù)研究影響因素分類(lèi),可以分為簡(jiǎn)單關(guān)聯(lián)性分析和多因素關(guān)聯(lián)性分析。簡(jiǎn)單關(guān)聯(lián)性分析可以進(jìn)行T檢驗(yàn)、F檢驗(yàn)、卡方檢驗(yàn)、秩和檢驗(yàn)、Log-rank檢驗(yàn)、線性檢驗(yàn)、logistic回歸分析,多因素關(guān)聯(lián)性分析可以進(jìn)行線性檢驗(yàn)、logistics回歸分析、cox比例風(fēng)險(xiǎn)回歸分析。
? ? 根據(jù)控制混雜偏倚可以分組均衡比較,發(fā)現(xiàn)潛在混雜因素,具體方法同上段。
? ? 生存分析可以采用K-M法、Log-rank檢驗(yàn)和cox比例風(fēng)險(xiǎn)回歸分析。
? ??準(zhǔn)確來(lái)說(shuō),K-M方法是一種統(tǒng)計(jì)描述方法,就好比用餅狀圖來(lái)展示比例,用箱圖來(lái)展示連續(xù)變量。[6]
? ??Cox回歸本質(zhì)上是一種回歸模型,它沒(méi)有直接使用生存時(shí)間,而是使用了危險(xiǎn)度(hazard)作為因變量,該模型不用于估計(jì)生存率,而是用于因素分析,也就是找到某一個(gè)危險(xiǎn)因素對(duì)結(jié)局事件發(fā)生的貢獻(xiàn)度。
? ??使用K-M方法繪制生存曲線,使用log-rank檢驗(yàn)評(píng)估生存差異。使用Cox比例風(fēng)險(xiǎn)模型進(jìn)行多因素分析,評(píng)估預(yù)后因素作用。






此為2004年發(fā)表在新英格蘭NEJM的一篇文章。

參考文獻(xiàn):
[1]如何進(jìn)行SPSS的重復(fù)測(cè)量方差分析,澤洋,IBM SPSS Statistics 中文網(wǎng)站,2021-01-21
[2]Q-Q圖的理解,王暢,CSDN,2015-11-04
[3]SPSS入門(mén)教程——方差齊性檢驗(yàn)的方法有哪些,nekonekoboom,CSDN,2021-08-26
[4]Fisher確切概率法在醫(yī)學(xué)統(tǒng)計(jì)中的應(yīng)用及spss中的操作——杏花開(kāi)醫(yī)學(xué)統(tǒng)計(jì),企鵝號(hào)-杏花統(tǒng)計(jì),騰訊云開(kāi)發(fā)者社區(qū),2017-12-13
[5]秩和檢驗(yàn)(Rank sum test),MBA智庫(kù)·百科,2014-09-15
[6]從一篇新英格蘭文章看懂K-M曲線與Cox的關(guān)系,易侕統(tǒng)計(jì),搜狐,2018-12-06