最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

你沒看過的傻瓜統(tǒng)計學(xué)!

2022-01-29 14:39 作者:愛數(shù)據(jù)分析社區(qū)  | 我要投稿

來? 源:簡書/作? 者:存存baby

01 ?相關(guān)性比較??根據(jù)數(shù)據(jù)類型??!

數(shù)值數(shù)據(jù)與數(shù)值數(shù)據(jù)——相關(guān)系數(shù)

數(shù)值數(shù)據(jù)與分類數(shù)據(jù)——相關(guān)比

分類數(shù)據(jù)與分類數(shù)據(jù)——克萊姆相關(guān)系數(shù)——獨立性檢驗(卡方檢驗)——畫表格求卡方值,然后根據(jù)獨立性檢驗,作出檢驗假設(shè)證明是否具有相關(guān)性。


02? 數(shù)據(jù)有兩大類

連續(xù)變量(正態(tài)或非正態(tài))、分類變量(二分類或多分類)。


連續(xù)變量中,正態(tài)與非正態(tài)數(shù)據(jù)表示方法是不一樣的。正態(tài)數(shù)據(jù)一般用均數(shù)“土”標(biāo)準(zhǔn)差(x±s) 方式表示,其數(shù)據(jù)95.45%處于x±s 范闈內(nèi);非正態(tài)數(shù)據(jù)用中位數(shù)和四分位間距表示;分類變量表示方法更直接,通常為頻率與百分?jǐn)?shù)。


03? 比較單個結(jié)局和單個變量

最常見的情況就是比較兩種處理的結(jié)果有何差異 。

如比較兩組獨立的結(jié)果,正態(tài)分布應(yīng)選用t檢驗;連續(xù)非正態(tài)分布選用Mann-Whitney或Wilcoxon秩和檢驗;分類變量選用卡方檢驗,當(dāng)數(shù)據(jù)量很小時,應(yīng)用Fisher檢驗。?

p為0.05的意義是:若不斷重復(fù)檢驗,差異由偶然導(dǎo)致的概率為5%。


04? 趨勢檢驗

比較單個結(jié)局和多個變量,很多情況下,結(jié)局受多個變量影響,回歸分析適用于這種情況。


其中包括線性(liner)回歸,可應(yīng)用于連續(xù)正態(tài)分布的結(jié)局,如血鉀。二分類結(jié)局可應(yīng)用邏輯(logistic)回歸,其分析結(jié)果用比值比表示,即事件發(fā)生的比值與不發(fā)生比值的比值。比值比常被誤解為相對風(fēng)險。同樣需要對不同的結(jié)局類型采用相應(yīng)的回歸分析。一個常犯的錯誤是將連續(xù)變量轉(zhuǎn)為二分類,本應(yīng)使用線性回歸,最后使用了logistic回歸 。


以上均是一種結(jié)局(單個或多個自變)情況,沒有考慮時間或丟失數(shù)據(jù)的因素,不能用于生存分析。對于生存分析,應(yīng)用Cox比例風(fēng)險回歸。計算得出風(fēng)險比,表示死亡的相對風(fēng)險 。


等級資料用spearman相關(guān)性分析 (見下表)

軟件要求作者選擇是否配對(Paired和Unpaired), 并決定選擇參數(shù)檢驗還是非參數(shù)檢驗。所謂參數(shù)檢驗就是指配對t檢驗或獨立樣本t檢驗,而非參數(shù)檢驗則是指Mann-Whitney U檢驗或配對Wilcoxon檢驗。如果選擇參數(shù)檢驗(默認(rèn)兩組數(shù)據(jù)均 呈正態(tài)分布),軟件會讓操作者選擇方差是否齊。如果方差齊,軟件會選擇t檢驗,如果不齊,軟件推薦Welch法。需要說明的一點是,如果兩組數(shù)據(jù)均呈正態(tài)分布,但方差不齊,此時應(yīng)采用校正t檢驗,目前有3種主要的校正t檢驗法:Cochran & Cox法、 Satterthwait法和Welch法。Graph Pad Prism僅支持Welch法。如果兩組數(shù)據(jù)不呈正態(tài)分布,則應(yīng)該選用非參數(shù)檢驗。非參數(shù)的兩個選項分別是Mann-Whitney U檢驗和Kolmogorov-Smirnov檢驗。一般選擇Mann-WhitneyU檢驗。

參數(shù)分析結(jié)果的解讀與此類似,只不過多了個 " F test ?to ?compare varian ces" ?, ?即方差是否齊 。一 般認(rèn)為, p值 > 0.10才可以認(rèn)為兩組數(shù)據(jù)方差 相同(注意 :是大于 , 不是小于 !是0. 10 , 不是0.05 ! ) 。


05 ?如何判斷數(shù)據(jù)是否成正態(tài)分布?

GraphPad Prism提供了3種檢驗數(shù)據(jù)是否呈正態(tài)分布的方法:D'Agootino-Pearson法,Kolmogorov-Smirnov法和Shapiro-Wilk法。針對同一種數(shù)據(jù),3種方法的計算結(jié)果大同小異。雖然GraphPad Prism不推薦用。

Kolmogorov-Smirnov法,但根據(jù)筆者經(jīng)驗,在國際上發(fā)表論文時,多采用Kolmogorov-Smirnov法的結(jié)果,可能是因為當(dāng)樣本太小時,Shapiro-Wilk法和D'Agootino-Pearson法無法給出檢驗結(jié)果。當(dāng)然,也可以3種方法都選擇,綜合判斷數(shù)據(jù)是否呈正態(tài)分布。具體在Column statistics下拉菜單中normality and lognormality tests(正態(tài)或?qū)?shù)正態(tài)分布)。選擇好統(tǒng)計方法之后點擊 "OK", 就可以得到正態(tài)檢驗的結(jié)果。


需要特別說明的是:在正態(tài)檢驗中,一般認(rèn)為p>0.10才表示數(shù)據(jù)呈正態(tài)分布(是大于,不是小于!是0.10, 不是0.05!)



06? 繪制生存曲線

進(jìn)入上述界面后點擊選中左側(cè) "Survival" 模式,之后點擊 "Create" , ?之后進(jìn)入了GraphPad Prism的主界面。GraphPad Prism 主界面的第一個縱列(標(biāo)志了 X 的縱列)是用來輸入隨訪時間的,其余縱列則輸入患者的結(jié)局.每一個縱列代表了 一個組。輸入數(shù)據(jù)如下圖:


圖像自動生成。

雙擊圖片進(jìn)行顏色修改


07? t檢驗


t檢驗有三種類型:獨立樣本t檢驗、配對樣本t檢驗和單樣本t檢驗。若實驗組和對照組未進(jìn)行配對,在符合獨立樣本t檢驗使用條件的情況下,可采用獨立樣本t檢驗比較兩組數(shù)據(jù)的差異是否具有統(tǒng)計學(xué)意義;若實驗組和對照組進(jìn)行配對,在符合配對樣本t檢驗使用條件的情況下,則應(yīng)該使用配對t檢驗。?


獨立樣本t檢驗對數(shù)據(jù)的基本要求是:1.數(shù)據(jù)呈正態(tài)分布 2.總體方差相等。配對樣本的t檢驗則要求兩組數(shù)據(jù)的差值呈正態(tài)分布 。?


數(shù)據(jù)是否符合正態(tài)分布?可以采用Kolmogorov-Smirnov檢驗或Shapiro-Wilk檢驗。在R中可以使用ks.test()函數(shù)。


1. 若數(shù)據(jù)呈正態(tài)分布,若方差整齊,則建議作者采用獨立樣本t檢驗的結(jié)果;但方差不整齊,則可以采用近似t檢驗對數(shù)據(jù)進(jìn)行分析。SPSS軟件在進(jìn)行t檢驗時,會自動計算方差齊性檢驗的結(jié)果,并同時告知t檢驗和近似t檢驗的統(tǒng)計學(xué)結(jié)果。


2. 大多數(shù)醫(yī)學(xué)數(shù)據(jù)都不呈正態(tài)分布 ,如血脂、血糖、肝酶、腫瘤標(biāo)志物等.因此不宜使用 t檢驗進(jìn)行兩組數(shù)據(jù)的比較 , 而應(yīng)該采用非參數(shù)統(tǒng)計方法,如Mann-Whitney檢驗 。

若實驗設(shè)計有多個組,即同一實驗因素下有多個分組 , 則不宜反復(fù)采用t檢驗進(jìn)行組間比較。而應(yīng)該采用單因素方差分析或K.ruskal-Wallis H檢驗,先從總體上明確幾組之間的差異是否有統(tǒng)計學(xué)意義,然后根據(jù)研究需要決定是否進(jìn)行兩組間的比較,采用何種方法進(jìn)行比較。

08? 卡方檢驗


主要用于對分類資料進(jìn)行比較分析。

處理四格表數(shù)據(jù)是卡方檢驗最為常見的用途之一。其目的在于分析”構(gòu)成比”或者”率”之間的差異是否具有統(tǒng)計學(xué)意義。

  • 對于四格表數(shù)據(jù),使用卡方檢驗的條件:樣本量>40?、且最小理論頻數(shù)應(yīng)>5。?

  • 對于某些小樣本的、或者指標(biāo)陽性率較低的研究,總樣本量可能<40, 最小理論頻數(shù)也可能<5, ?此時應(yīng)該采用Fisher確切概率法進(jìn)行分析.

  • 對于等級資料,秩轉(zhuǎn)換之后進(jìn)行Mann-Whitney U檢驗。

  • 對于畫表問題,不變的在左側(cè),變化的在上邊,具體見下邊表格的例子。

總結(jié):分類資料用卡方,等級資料用秩和。


實際上,從理論上講,若要分析四格表數(shù)據(jù)中的構(gòu)成比或者率之間的差異是否有統(tǒng)計學(xué)意義, Fisher確切概率法的結(jié)果是最可靠的。若是使用軟件對數(shù)據(jù)進(jìn)行分析,不論樣本量和最小理論頻數(shù),均可采用Fisher確切概率法。


卡方檢驗回答的問題僅僅是"構(gòu)成比”或者"率”之間的差異是否具有統(tǒng)計學(xué)意義,而不能回答效應(yīng)指標(biāo)的強度高低問題。


對于等級資料,不是率和構(gòu)成比的問題,而是分期等問題,所以處理此類數(shù)據(jù)的一般方法是將分期進(jìn)行秩轉(zhuǎn)換,然后以秩和檢驗(Mann-Whitney 檢驗)進(jìn)行統(tǒng)計分析 。

-END-

新年快樂!

愛數(shù)據(jù)準(zhǔn)備了一份完整、全面的

統(tǒng)計學(xué)知識高清思維導(dǎo)圖(共17張)

掃描/識別下方二維碼

回復(fù)【統(tǒng)計17】即可領(lǐng)取~

(有關(guān)數(shù)據(jù)分析相關(guān)課程也可咨詢哦)


?


你沒看過的傻瓜統(tǒng)計學(xué)!的評論 (共 條)

分享到微博請遵守國家法律
龙里县| 改则县| 彭泽县| 临西县| 延寿县| 平山县| 图们市| 吉木萨尔县| 防城港市| 巴马| 河间市| 拉萨市| 镇宁| 拜城县| 泽州县| 庆安县| 龙陵县| 周口市| 观塘区| 武穴市| 乌鲁木齐市| 宜兰县| 达拉特旗| 静安区| 遂宁市| 府谷县| 铜川市| 丰城市| 游戏| 桦川县| 陕西省| 平和县| 海宁市| 天峻县| 安吉县| 花莲市| 河源市| 旌德县| 图木舒克市| 克拉玛依市| 中山市|