何時(shí)應(yīng)該使用非參數(shù)檢驗(yàn)?
俗話說得好,方差有三寶:獨(dú)立、正態(tài)、齊性好。什么意思呢?就是說使用方差分析需要三個(gè)前提條件:1、各樣本須是相互獨(dú)立的隨機(jī)樣本;2、各樣本來自正態(tài)分布總體;3、各總體方差相等,即方差齊。
縱然方差分析的用途廣泛,可以不受比較組數(shù)的限制,進(jìn)行多組比較。然而在實(shí)際的數(shù)據(jù)分析中,我們辛苦收集的數(shù)據(jù)往往很難符合其使用的條件。但我們又需要從樣本數(shù)據(jù)中,獲得盡可能多的信息,此時(shí)使用非參數(shù)檢驗(yàn)就再適合不過了。
非參數(shù)檢驗(yàn)類別
按照樣本數(shù)量分類,可以將非參數(shù)檢驗(yàn)方法分為幾個(gè)方面:

單樣本非參數(shù)檢驗(yàn)方法
卡方檢驗(yàn):用于分析定類數(shù)據(jù)與定類數(shù)據(jù)之間的關(guān)系情況,例如不同減肥治療方式對(duì)于減肥的幫助情況(膽固醇水平)??ǚ綑z驗(yàn)用于研究X和Y之間的關(guān)系,且X,Y均為定類數(shù)據(jù)。并且卡方檢驗(yàn)需要使用卡方值和對(duì)應(yīng)P值去判斷X與Y之間是否有差異。通常情況下,共有三種卡方值,分別是Pearson卡方,yates校正卡方,fisher卡方;優(yōu)先使用Pearson卡方,其次為yates校正卡方,最后為fisher卡方。
二項(xiàng)分布檢驗(yàn):是指在只會(huì)產(chǎn)生兩種可能結(jié)果如陰性、陽性之一的n次獨(dú)立重復(fù)試驗(yàn)(常常稱為n重Bernoulli試驗(yàn))中,每次試驗(yàn)的“陽性”概率保持不變時(shí),出現(xiàn)“陽性”的次數(shù)X=0,1,2......n的一種概率分布。在醫(yī)學(xué)研究中較為常用。
單樣本K-S檢驗(yàn):單樣本K-S檢驗(yàn)?zāi)軌蚶脴颖緮?shù)據(jù)推斷樣本來自的總體是否服從某一理論分布(正態(tài)分布,均勻分布,泊松分布,指數(shù)分布)。適用于探索連續(xù)型隨機(jī)變量分布。
單樣本W(wǎng)ilcoxon檢驗(yàn):(也稱單樣本wilcoxon符號(hào)秩和檢驗(yàn),符號(hào)秩和檢驗(yàn),也或者秩和檢驗(yàn)等);其被用于檢驗(yàn)數(shù)據(jù)是否與某數(shù)字有明顯的差異性。首先需要判斷數(shù)據(jù)是否呈現(xiàn)出正態(tài)性分析特質(zhì),如果數(shù)據(jù)呈現(xiàn)出正態(tài)性特質(zhì),此時(shí)應(yīng)該使用單樣本T檢驗(yàn)進(jìn)行檢驗(yàn);如果數(shù)據(jù)沒有呈現(xiàn)出正態(tài)性特質(zhì),此時(shí)應(yīng)該使用單樣本W(wǎng)ilcoxon檢驗(yàn)。
游程檢驗(yàn):游程檢驗(yàn)用于檢驗(yàn)數(shù)據(jù)是否具有隨機(jī)性,其原始假設(shè)是數(shù)據(jù)序列不具有隨機(jī)性;如果檢驗(yàn)結(jié)果顯示P值小于0.05,則說明數(shù)據(jù)不具有隨機(jī)性,反之P值大于等于0.05則說明數(shù)據(jù)具有隨機(jī)性。如果數(shù)據(jù)有上升或下降的趨勢(shì),或有呈周期性變化的規(guī)律等特征時(shí),均可能表示數(shù)據(jù)與順序是有關(guān)的,或者說序列不是隨機(jī)出現(xiàn)的。通俗來講,游程檢驗(yàn)是用于分析數(shù)據(jù)是否為隨機(jī)。
兩獨(dú)立樣本非參數(shù)檢驗(yàn)方法
MannWhitney U 檢驗(yàn):是用得最廣泛的兩獨(dú)立樣本秩和檢驗(yàn)方法。用于研究定類數(shù)據(jù)與定量數(shù)據(jù)之間的關(guān)系情況。例如研究人員想知道不同性別學(xué)生的購(gòu)買意愿是否有顯著差異,如果購(gòu)買意愿沒有呈現(xiàn)出正態(tài)性特質(zhì),此時(shí)建議可使用MannWhitney U 檢驗(yàn)。其原假設(shè)是:兩獨(dú)立樣本來自的兩總體的分布無顯著差異。
W-W游程檢驗(yàn):用來檢驗(yàn)兩獨(dú)立樣本來自的兩總體的分布是否存在顯著差異。通過分析游程的大小和數(shù)量實(shí)現(xiàn)游程檢驗(yàn),從而判斷兩組樣本在混合序列中的排列是否為隨機(jī)的。若兩組樣本在混合序列中的排列是隨機(jī)的,則兩組樣本之間沒有顯著性差異。
極端反應(yīng)檢驗(yàn):從另一角度檢驗(yàn)兩獨(dú)立樣本所來自的量總體分布是否存在顯著性差異。其基本思想是:將一組樣本作為控制樣本,另一組樣本作為實(shí)驗(yàn)樣本。以控制樣本作為對(duì)照,檢驗(yàn)試驗(yàn)樣本相對(duì)于控制樣本是否出現(xiàn)了極端反應(yīng)。如實(shí)驗(yàn)樣本沒有出現(xiàn)極端反應(yīng),則認(rèn)為兩總體分布無顯著差異,相反則認(rèn)為存在顯著差異。
兩配對(duì)樣本的非參數(shù)檢驗(yàn)方法
McNemar檢驗(yàn):用于兩配對(duì)樣本的分析,其將研究對(duì)象自身作為對(duì)照者檢驗(yàn)其“前后”變化是否有顯著差異,例如比較同一批觀測(cè)對(duì)象用藥前后或?qū)嶒?yàn)前后的結(jié)果有無差異。該檢驗(yàn)只適用于二分變量,即只有兩種可能“是”或“否”,“陽性”或“陰性”,“有反應(yīng)”或“無反應(yīng)”等,對(duì)于非二分變量,應(yīng)在分析前進(jìn)行數(shù)據(jù)變換。
符號(hào)檢驗(yàn):也是用來檢驗(yàn)配對(duì)樣本所來自的總體的分布是否存在顯著性差異的非參數(shù)方法。符號(hào)檢驗(yàn)法是通過兩個(gè)相關(guān)樣本的每對(duì)數(shù)據(jù)之差的符號(hào)進(jìn)行檢驗(yàn),從而比較兩個(gè)樣本的顯著性。由于這種方法只考慮符號(hào),不考察差數(shù)的大小,因而失去樣本所提供的一部分信息,準(zhǔn)確度不高。因此除了小樣本,一般不使用符號(hào)檢驗(yàn)。
配對(duì)樣本W(wǎng)ilcoxon檢驗(yàn):配對(duì)樣本W(wǎng)ilcoxon檢驗(yàn)用于檢驗(yàn)配對(duì)數(shù)據(jù)是否具有顯著性差異,比如實(shí)驗(yàn)組和對(duì)照組的成績(jī)差異性,手術(shù)前和手術(shù)后的體重差異性。從功能上講,配對(duì)樣本W(wǎng)ilcoxon檢驗(yàn)與配對(duì)樣本T檢驗(yàn)完全一致,區(qū)別僅在于數(shù)據(jù)是否正態(tài)。
多獨(dú)立樣本的非參數(shù)檢驗(yàn)方法
中位數(shù)檢驗(yàn):用來檢驗(yàn)多個(gè)獨(dú)立樣本來自的總體的中位數(shù)是否存在顯著差異。其基本思路:先求取混合后數(shù)據(jù)的中位數(shù),然后利用卡方分布統(tǒng)計(jì)量來計(jì)算每個(gè)樣本組內(nèi)中位數(shù)兩側(cè)個(gè)案數(shù)的差異性。
K-W檢驗(yàn):用于檢驗(yàn)多個(gè)總體的分布是否存在顯著差異。SPSSAU會(huì)自動(dòng)選擇MannWhitney或者Kruskal-Wallis統(tǒng)計(jì)量。如果X的組別為兩組,比如男和女共兩組,則應(yīng)該使用MannWhitney統(tǒng)計(jì)量,如果組別超過兩組,則應(yīng)該使用Kruskal-Wallis統(tǒng)計(jì)量結(jié)果。
多個(gè)配對(duì)樣本非參數(shù)檢驗(yàn)方法

如果是多相關(guān)樣本,并且目的在于研究差異性,則有Friedeman檢驗(yàn)和CochranQ檢驗(yàn)兩項(xiàng)可用,但特別提示一點(diǎn),CochranQ檢驗(yàn)涉及的數(shù)據(jù)一定是二分類(即1和0這樣的數(shù)據(jù));如果是研究多相關(guān)樣本的一致性情況,則可使用Kendall協(xié)調(diào)系數(shù)。
參數(shù)或非參數(shù)的正確選擇
選擇參數(shù)檢驗(yàn)或非參數(shù)檢驗(yàn)需要結(jié)合專業(yè)情況以及數(shù)據(jù)類型數(shù)據(jù)形態(tài),綜合參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)的優(yōu)缺點(diǎn)進(jìn)行考量,方法的選擇沒有絕對(duì)意義上的標(biāo)準(zhǔn)答案。
參數(shù)檢驗(yàn)假定總體分布服從正態(tài)或近似正態(tài),如果數(shù)據(jù)服從正態(tài)分布,參數(shù)檢驗(yàn)是最好的選擇。如果不滿足這些條件的情況下,依然使用參數(shù)檢驗(yàn)分析,很可能讓檢驗(yàn)結(jié)果產(chǎn)生錯(cuò)誤。而非參數(shù)檢驗(yàn)不受數(shù)據(jù)分布的限制,檢驗(yàn)條件比較寬松,對(duì)于總體未知的樣本都可以適用。但非參數(shù)檢驗(yàn)也存在不足,非參數(shù)檢驗(yàn)對(duì)總體假定不多,因而會(huì)缺乏針對(duì)性,功效不如參數(shù)檢驗(yàn)。
同時(shí)樣本的數(shù)量也影響著選擇何種方法。一般來說小樣本用非參數(shù)檢驗(yàn),大樣本采用參數(shù)檢驗(yàn)。原因是參數(shù)檢驗(yàn)假定了服從某種分布,當(dāng)樣本量過小時(shí),無法識(shí)別數(shù)據(jù)分布狀態(tài),而非參數(shù)檢驗(yàn)對(duì)樣本量沒有要求,因此可選擇非參數(shù)檢驗(yàn)。