你沒看過的傻瓜統(tǒng)計學(xué)!
來? 源:簡書/作? 者:存存baby
01 ?相關(guān)性比較??根據(jù)數(shù)據(jù)類型??!
數(shù)值數(shù)據(jù)與數(shù)值數(shù)據(jù)——相關(guān)系數(shù)
數(shù)值數(shù)據(jù)與分類數(shù)據(jù)——相關(guān)比
分類數(shù)據(jù)與分類數(shù)據(jù)——克萊姆相關(guān)系數(shù)——獨立性檢驗(卡方檢驗)——畫表格求卡方值,然后根據(jù)獨立性檢驗,作出檢驗假設(shè)證明是否具有相關(guān)性。
02? 數(shù)據(jù)有兩大類
連續(xù)變量(正態(tài)或非正態(tài))、分類變量(二分類或多分類)。
連續(xù)變量中,正態(tài)與非正態(tài)數(shù)據(jù)表示方法是不一樣的。正態(tài)數(shù)據(jù)一般用均數(shù)“土”標(biāo)準(zhǔn)差(x±s) 方式表示,其數(shù)據(jù)95.45%處于x±s 范闈內(nèi);非正態(tài)數(shù)據(jù)用中位數(shù)和四分位間距表示;分類變量表示方法更直接,通常為頻率與百分?jǐn)?shù)。
03? 比較單個結(jié)局和單個變量
最常見的情況就是比較兩種處理的結(jié)果有何差異 。
如比較兩組獨立的結(jié)果,正態(tài)分布應(yīng)選用t檢驗;連續(xù)非正態(tài)分布選用Mann-Whitney或Wilcoxon秩和檢驗;分類變量選用卡方檢驗,當(dāng)數(shù)據(jù)量很小時,應(yīng)用Fisher檢驗。?
p為0.05的意義是:若不斷重復(fù)檢驗,差異由偶然導(dǎo)致的概率為5%。
04? 趨勢檢驗
比較單個結(jié)局和多個變量,很多情況下,結(jié)局受多個變量影響,回歸分析適用于這種情況。
其中包括線性(liner)回歸,可應(yīng)用于連續(xù)正態(tài)分布的結(jié)局,如血鉀。二分類結(jié)局可應(yīng)用邏輯(logistic)回歸,其分析結(jié)果用比值比表示,即事件發(fā)生的比值與不發(fā)生比值的比值。比值比常被誤解為相對風(fēng)險。同樣需要對不同的結(jié)局類型采用相應(yīng)的回歸分析。一個常犯的錯誤是將連續(xù)變量轉(zhuǎn)為二分類,本應(yīng)使用線性回歸,最后使用了logistic回歸 。
以上均是一種結(jié)局(單個或多個自變)情況,沒有考慮時間或丟失數(shù)據(jù)的因素,不能用于生存分析。對于生存分析,應(yīng)用Cox比例風(fēng)險回歸。計算得出風(fēng)險比,表示死亡的相對風(fēng)險 。
等級資料用spearman相關(guān)性分析 (見下表)


軟件要求作者選擇是否配對(Paired和Unpaired), 并決定選擇參數(shù)檢驗還是非參數(shù)檢驗。所謂參數(shù)檢驗就是指配對t檢驗或獨立樣本t檢驗,而非參數(shù)檢驗則是指Mann-Whitney U檢驗或配對Wilcoxon檢驗。如果選擇參數(shù)檢驗(默認(rèn)兩組數(shù)據(jù)均 呈正態(tài)分布),軟件會讓操作者選擇方差是否齊。如果方差齊,軟件會選擇t檢驗,如果不齊,軟件推薦Welch法。需要說明的一點是,如果兩組數(shù)據(jù)均呈正態(tài)分布,但方差不齊,此時應(yīng)采用校正t檢驗,目前有3種主要的校正t檢驗法:Cochran & Cox法、 Satterthwait法和Welch法。Graph Pad Prism僅支持Welch法。如果兩組數(shù)據(jù)不呈正態(tài)分布,則應(yīng)該選用非參數(shù)檢驗。非參數(shù)的兩個選項分別是Mann-Whitney U檢驗和Kolmogorov-Smirnov檢驗。一般選擇Mann-WhitneyU檢驗。
參數(shù)分析結(jié)果的解讀與此類似,只不過多了個 " F test ?to ?compare varian ces" ?, ?即方差是否齊 。一 般認(rèn)為, p值 > 0.10才可以認(rèn)為兩組數(shù)據(jù)方差 相同(注意 :是大于 , 不是小于 !是0. 10 , 不是0.05 ! ) 。
05 ?如何判斷數(shù)據(jù)是否成正態(tài)分布?
GraphPad Prism提供了3種檢驗數(shù)據(jù)是否呈正態(tài)分布的方法:D'Agootino-Pearson法,Kolmogorov-Smirnov法和Shapiro-Wilk法。針對同一種數(shù)據(jù),3種方法的計算結(jié)果大同小異。雖然GraphPad Prism不推薦用。
Kolmogorov-Smirnov法,但根據(jù)筆者經(jīng)驗,在國際上發(fā)表論文時,多采用Kolmogorov-Smirnov法的結(jié)果,可能是因為當(dāng)樣本太小時,Shapiro-Wilk法和D'Agootino-Pearson法無法給出檢驗結(jié)果。當(dāng)然,也可以3種方法都選擇,綜合判斷數(shù)據(jù)是否呈正態(tài)分布。具體在Column statistics下拉菜單中normality and lognormality tests(正態(tài)或?qū)?shù)正態(tài)分布)。選擇好統(tǒng)計方法之后點擊 "OK", 就可以得到正態(tài)檢驗的結(jié)果。
需要特別說明的是:在正態(tài)檢驗中,一般認(rèn)為p>0.10才表示數(shù)據(jù)呈正態(tài)分布(是大于,不是小于!是0.10, 不是0.05!)

06? 繪制生存曲線
進(jìn)入上述界面后點擊選中左側(cè) "Survival" 模式,之后點擊 "Create" , ?之后進(jìn)入了GraphPad Prism的主界面。GraphPad Prism 主界面的第一個縱列(標(biāo)志了 X 的縱列)是用來輸入隨訪時間的,其余縱列則輸入患者的結(jié)局.每一個縱列代表了 一個組。輸入數(shù)據(jù)如下圖:

圖像自動生成。

07? t檢驗

t檢驗有三種類型:獨立樣本t檢驗、配對樣本t檢驗和單樣本t檢驗。若實驗組和對照組未進(jìn)行配對,在符合獨立樣本t檢驗使用條件的情況下,可采用獨立樣本t檢驗比較兩組數(shù)據(jù)的差異是否具有統(tǒng)計學(xué)意義;若實驗組和對照組進(jìn)行配對,在符合配對樣本t檢驗使用條件的情況下,則應(yīng)該使用配對t檢驗。?
獨立樣本t檢驗對數(shù)據(jù)的基本要求是:1.數(shù)據(jù)呈正態(tài)分布 2.總體方差相等。配對樣本的t檢驗則要求兩組數(shù)據(jù)的差值呈正態(tài)分布 。?
數(shù)據(jù)是否符合正態(tài)分布?可以采用Kolmogorov-Smirnov檢驗或Shapiro-Wilk檢驗。在R中可以使用ks.test()函數(shù)。
1. 若數(shù)據(jù)呈正態(tài)分布,若方差整齊,則建議作者采用獨立樣本t檢驗的結(jié)果;但方差不整齊,則可以采用近似t檢驗對數(shù)據(jù)進(jìn)行分析。SPSS軟件在進(jìn)行t檢驗時,會自動計算方差齊性檢驗的結(jié)果,并同時告知t檢驗和近似t檢驗的統(tǒng)計學(xué)結(jié)果。
2. 大多數(shù)醫(yī)學(xué)數(shù)據(jù)都不呈正態(tài)分布 ,如血脂、血糖、肝酶、腫瘤標(biāo)志物等.因此不宜使用 t檢驗進(jìn)行兩組數(shù)據(jù)的比較 , 而應(yīng)該采用非參數(shù)統(tǒng)計方法,如Mann-Whitney檢驗 。
若實驗設(shè)計有多個組,即同一實驗因素下有多個分組 , 則不宜反復(fù)采用t檢驗進(jìn)行組間比較。而應(yīng)該采用單因素方差分析或K.ruskal-Wallis H檢驗,先從總體上明確幾組之間的差異是否有統(tǒng)計學(xué)意義,然后根據(jù)研究需要決定是否進(jìn)行兩組間的比較,采用何種方法進(jìn)行比較。
08? 卡方檢驗
主要用于對分類資料進(jìn)行比較分析。
處理四格表數(shù)據(jù)是卡方檢驗最為常見的用途之一。其目的在于分析”構(gòu)成比”或者”率”之間的差異是否具有統(tǒng)計學(xué)意義。
對于四格表數(shù)據(jù),使用卡方檢驗的條件:樣本量>40?、且最小理論頻數(shù)應(yīng)>5。?
對于某些小樣本的、或者指標(biāo)陽性率較低的研究,總樣本量可能<40, 最小理論頻數(shù)也可能<5, ?此時應(yīng)該采用Fisher確切概率法進(jìn)行分析.
對于等級資料,秩轉(zhuǎn)換之后進(jìn)行Mann-Whitney U檢驗。
對于畫表問題,不變的在左側(cè),變化的在上邊,具體見下邊表格的例子。
總結(jié):分類資料用卡方,等級資料用秩和。
實際上,從理論上講,若要分析四格表數(shù)據(jù)中的構(gòu)成比或者率之間的差異是否有統(tǒng)計學(xué)意義, Fisher確切概率法的結(jié)果是最可靠的。若是使用軟件對數(shù)據(jù)進(jìn)行分析,不論樣本量和最小理論頻數(shù),均可采用Fisher確切概率法。
卡方檢驗回答的問題僅僅是"構(gòu)成比”或者"率”之間的差異是否具有統(tǒng)計學(xué)意義,而不能回答效應(yīng)指標(biāo)的強度高低問題。
對于等級資料,不是率和構(gòu)成比的問題,而是分期等問題,所以處理此類數(shù)據(jù)的一般方法是將分期進(jìn)行秩轉(zhuǎn)換,然后以秩和檢驗(Mann-Whitney 檢驗)進(jìn)行統(tǒng)計分析 。
-END-
新年快樂!
愛數(shù)據(jù)準(zhǔn)備了一份完整、全面的
統(tǒng)計學(xué)知識高清思維導(dǎo)圖(共17張)
掃描/識別下方二維碼
回復(fù)【統(tǒng)計17】即可領(lǐng)取~
(有關(guān)數(shù)據(jù)分析相關(guān)課程也可咨詢哦)

?