醫(yī)學(xué)統(tǒng)計(jì)學(xué)常見分析方法分類匯總
醫(yī)學(xué)統(tǒng)計(jì)學(xué)已經(jīng)廣泛地應(yīng)用在醫(yī)學(xué)科學(xué)研究中。在文獻(xiàn)復(fù)習(xí)與研究設(shè)計(jì)、實(shí)驗(yàn)或觀察實(shí)施、數(shù)據(jù)收集與記錄、資料整理與分析、結(jié)果表達(dá)與解釋、報(bào)告撰寫與論文發(fā)表等環(huán)節(jié)無(wú)不涉及統(tǒng)計(jì)問題。淺淺總結(jié)一下醫(yī)學(xué)統(tǒng)計(jì)學(xué)常用分析方法。
一、差異性研究
差異性研究就是分析不同數(shù)據(jù)資料之間的差異性。簡(jiǎn)單可以分為研究單樣本、兩樣本、多樣本資料之間均數(shù)的差異性比較以及定類數(shù)據(jù)之間差異性比較;分類說(shuō)明如下:
1、單樣本均數(shù)比較
單樣本均數(shù)比較是指研究一組定量數(shù)據(jù)與一個(gè)數(shù)字之間的差異性。例如研究36名從事鉛作業(yè)男性的血紅蛋白含量與正常男性血紅蛋白均數(shù)140g/L的差異。當(dāng)數(shù)據(jù)滿足正態(tài)性時(shí),可以使用單樣本t檢驗(yàn)方法進(jìn)行研究;當(dāng)數(shù)據(jù)不滿足正態(tài)性時(shí),可以使用單樣本wilcoxon檢驗(yàn)進(jìn)行研究。
2兩樣本均數(shù)比較
兩樣本均數(shù)比較是指研究?jī)山M定量數(shù)據(jù)之間的差異性。
例如研究?jī)深惸z囊的降血糖效果是否有差異;而兩樣本設(shè)計(jì)又可以分為兩獨(dú)立樣本和兩配對(duì)樣本。
兩樣本相互獨(dú)立時(shí)——當(dāng)兩樣本數(shù)據(jù)都滿足正態(tài)性和方差齊性,則可以使用獨(dú)立樣本t檢驗(yàn)或者方差分析(單因素方差分析)進(jìn)行研究;當(dāng)數(shù)據(jù)呈正態(tài)且方差不齊時(shí),可以使用t'檢驗(yàn)或者welch方差、Brown-Forsythe方差進(jìn)行研究;當(dāng)數(shù)據(jù)非正態(tài)且方差不齊時(shí),則不能使用參數(shù)檢驗(yàn),應(yīng)該使用非參數(shù)檢驗(yàn)法—wilcoxon秩和檢驗(yàn)進(jìn)行分析。
兩樣本為配對(duì)設(shè)計(jì)時(shí)——當(dāng)兩配對(duì)數(shù)據(jù)的差值滿足正態(tài)性,使用配對(duì)樣本t檢驗(yàn)進(jìn)行研究;當(dāng)差值不滿足正態(tài)性時(shí),使用配對(duì)樣本wilcoxon檢驗(yàn)進(jìn)行分析。
3、多樣本均數(shù)比較
多樣本均數(shù)比較是指研究多組定量數(shù)據(jù)之間的差異性。
例如研究某種藥物不同劑量下小鼠的存活時(shí)間;而多樣本設(shè)計(jì)又可分為完全隨機(jī)設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、重復(fù)測(cè)量設(shè)計(jì)。
完全隨機(jī)設(shè)計(jì)——要將研究對(duì)象按照某個(gè)處理因素隨機(jī)分配為多個(gè)處理組(也稱為處理因素的水平),每組接受一種處理,最后判斷多個(gè)處理組之間有無(wú)差別。當(dāng)滿足正態(tài)性和方差齊性時(shí),使用方差分析進(jìn)行研究;不滿足時(shí),可以使用Kruskal-wallis H秩和檢驗(yàn)進(jìn)行分析。
隨機(jī)區(qū)組設(shè)計(jì)——是配對(duì)設(shè)計(jì)的擴(kuò)展。具體做法是:先按影響實(shí)驗(yàn)結(jié)果的非處理因素(如性別、體重、病情、病程等)將實(shí)驗(yàn)對(duì)象配成區(qū)組(block),再分別將各區(qū)組內(nèi)的實(shí)驗(yàn)對(duì)象隨機(jī)分配到各處理組或?qū)φ战M。當(dāng)滿足正態(tài)和方差齊時(shí),使用方差分析進(jìn)行研究;不滿足時(shí),可以使用Friedman秩檢驗(yàn)進(jìn)行分析。
重復(fù)測(cè)量設(shè)計(jì)——當(dāng)前后測(cè)量設(shè)計(jì)的重復(fù)測(cè)量次數(shù)m≥3時(shí),稱重復(fù)測(cè)量設(shè)計(jì)或重復(fù)測(cè)量數(shù)據(jù)。重復(fù)測(cè)量數(shù)據(jù)進(jìn)行組內(nèi)項(xiàng)差異分析時(shí),需要進(jìn)行球?qū)ΨQ假設(shè),當(dāng)滿足時(shí),直接使用重復(fù)測(cè)量方差分析結(jié)果;當(dāng)不滿足時(shí),采用Greenhouse-Geisser校正或者Huynh-Feldt校正結(jié)果分析。
4、定類數(shù)據(jù)比較
定類數(shù)據(jù)之間的差異性研究主要通過(guò)卡方檢驗(yàn)進(jìn)行分析。
例如研究患肺癌與是否吸煙之間的差異性;可以將定類數(shù)據(jù)資料分為四格表資料、R*C資料、2*2*K資料三類。
四格表資料——只有兩行兩列。又可以分為配對(duì)資料和非配對(duì)資料兩種。
配對(duì)資料例如分別使用抗原檢測(cè)和核酸檢測(cè)對(duì)同一批樣本檢驗(yàn)新冠病毒陽(yáng)性、陰性是否有差異。當(dāng)為2*2配對(duì)設(shè)計(jì)時(shí),采用McNemar檢驗(yàn);當(dāng)為n*n配對(duì)設(shè)計(jì)時(shí),采用Bowker檢驗(yàn)。非配對(duì)資料時(shí),當(dāng)總樣本量n≥40,且期望頻率E≥5時(shí),使用Pearson卡方;當(dāng)n≥40但其中一個(gè)格子出現(xiàn)1≤E<5時(shí),使用yates校正卡方;當(dāng)n<40或者E<1時(shí),使用Fisher卡方進(jìn)行分析(這一過(guò)程SPSSAU將自動(dòng)選擇)。
R*C表資料——當(dāng)行和列中任意一個(gè)大于等于2時(shí),稱為R*C表資料。
當(dāng)E全部>1 且 1 ≤E<5格子的比例小于20% 則使用Pearson卡方;否則使用yates校正卡方(SPSSAU將自動(dòng)選擇)。
2*2*K資料——卡方檢驗(yàn)研究X和Y的差異,X和Y均是類別數(shù)據(jù),當(dāng)前需要進(jìn)一步考慮另一個(gè)干擾因素分層項(xiàng)時(shí);比如是否吸煙(X)與是否得肺癌(Y)的關(guān)系時(shí),將性別納入考慮范疇此時(shí)應(yīng)該使用分層卡方進(jìn)行分析。
補(bǔ)充:除此之外,常用的卡方檢驗(yàn)還有卡方擬合優(yōu)度檢驗(yàn),用于分析預(yù)期的比例是否與實(shí)際的比例有著明顯的差異性。
二、相關(guān)性研究
研究數(shù)據(jù)之間的相關(guān)性,主要可以使用Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù)。
當(dāng)變量X和Y服從雙變量正態(tài)分布時(shí),可以使用Pearson相關(guān)進(jìn)行進(jìn)行相關(guān)分析;
Pearson相關(guān)系數(shù)計(jì)算公式如下:
當(dāng)變量X和Y不服從雙變量正態(tài)分布時(shí),則使用Spearman相關(guān)進(jìn)行相關(guān)分析;
當(dāng)變量X和Y均為多分類有序資料時(shí),可以用Spearman相關(guān)進(jìn)行相關(guān)分析。
Spearman相關(guān)系數(shù)計(jì)算公式如下:
相關(guān)系數(shù)沒有單位,其值為-1≤r≤1。r值為正表示正相關(guān),r值為負(fù)表示負(fù)相關(guān),r的絕對(duì)值等于1為完全相關(guān),r=0為零相關(guān)。在生物界由于影響因素眾多,因此很少完全相關(guān)。Pearson相關(guān)或者Spearman相關(guān)都要求觀察單位之間是獨(dú)立的。
三、影響因素研究
研究因變量Y的影響因素時(shí),按照因變量Y類型的不同,可以分為以下三類:
因變量Y為定量資料時(shí);當(dāng)自變量個(gè)數(shù)為1個(gè)時(shí),使用一元線性回歸分析進(jìn)行研究;當(dāng)自變量的個(gè)數(shù)為多個(gè)時(shí),使用多元線性回歸分析進(jìn)行研究。
因變量Y為定類資料時(shí);當(dāng)Y為二分類變量,如“是否患病”,此時(shí)使用二元logistic回歸分析進(jìn)行研究;與此同時(shí),如果是針對(duì)配對(duì)資料進(jìn)行分析的,則應(yīng)該使用條件logistic回歸分析。當(dāng)Y為多分類變量時(shí),使用多分類logistic回歸分析。當(dāng)Y為有序多分類變量時(shí),如“無(wú)效、好轉(zhuǎn)、痊愈”,應(yīng)該使用有序logistic回歸分析。
因變量Y為生存資料時(shí):此時(shí)共有兩個(gè)因變量,Y1表示生存時(shí)間,Y2表示生存狀態(tài),且0表示生存,1表示死亡,兩個(gè)因變量缺一不可,此時(shí)應(yīng)該使用cox回歸。
以上就是今天的全部?jī)?nèi)容,主要講了醫(yī)學(xué)統(tǒng)計(jì)學(xué)比較常用的差異性研究方法、相關(guān)性研究方法以及影響因素研究方法。還想看什么其他內(nèi)容,請(qǐng)留言告訴我哦~
參考文獻(xiàn):[1]孫振球,徐勇勇.醫(yī)學(xué)統(tǒng)計(jì)學(xué).第4版[M].人民衛(wèi)生出版社,2014