數(shù)理統(tǒng)計分析方法及數(shù)學原理
(1)正態(tài)性檢驗:利用觀測數(shù)據(jù)判斷總體是否服從正態(tài)分布的檢驗稱為正態(tài)性檢驗,它是統(tǒng)計判決中重要的一種特殊的擬合優(yōu)度假設檢驗。常用的正態(tài)性檢驗方法有正態(tài)概率紙法、夏皮羅維爾克檢驗法(Shapiro-Wilktest),科爾莫戈羅夫檢驗法,偏度-峰度檢驗法等。


(2)方差齊性檢驗:F檢驗(F-test),最常用的別名叫做聯(lián)合假設檢驗(英語:joint hypotheses test),此外也稱方差比率檢驗、方差齊性檢驗。它是一種在零假設(null hypothesis, H0)之下,統(tǒng)計值服從F-分布的檢驗。其通常是用來分析用了超過一個參數(shù)的統(tǒng)計模型,以判斷該模型中的全部或一部分參數(shù)是否適合用來估計母體。


(3)t檢驗:t檢驗,亦稱student t檢驗(Student's t test),主要用于樣本含量較?。ɡ鏽 < 30),總體標準差σ未知的正態(tài)分布。?t檢驗是用t分布理論來推論差異發(fā)生的概率,從而比較兩個平均數(shù)的差異是否顯著。t檢驗可分為單總體檢驗和雙總體檢驗,以及配對樣本檢驗。




(4)曼-惠特尼(Mann whitney)U檢驗:
第一步:將兩組樣本數(shù)據(jù)混合,并按照數(shù)據(jù)大小的升序編排等級。最小的數(shù)據(jù)等級為1,第二小的數(shù)據(jù)等級為2,以此類推(注意,如果混合后的數(shù)據(jù)中存在相等的情況,那么相同數(shù)據(jù)的等級值應該是相同的,并取未經排名的數(shù)組中的平均值。如數(shù)據(jù){3, 5, 5, 9},那么他們的等級值應該是{1, 2.5, 2.5, 4}。)
第二步:分別求出兩個樣本的等級和R1,R2。
第三步:假設n1?= “一號樣本觀察值的項數(shù)”;n2?= “二號樣本觀察值的項數(shù)”;R1?= “一號樣本各項等級和”;R2?= “二號樣本中各項等級和”。那么U1,?U2?的計算公式分別如下所示:
U1?=?R1?-?n1*(n1+1)/?2
U2?=?R2?-?n2*(n2+1)/?2
那么 U1與U2之和的計算公式如下所示,
U1?+?U2?=?R1?+?R2?-?(n1?*?(n1?+?1)?+?n2?*?(n2?+?1))/?2
設2組樣本總共數(shù)據(jù)有N?個,即 N = n1 + n2,又因為R1 + R2 = N(N + 1)/ 2 ,代入上式,可得
U1?+?U2?=?n1?*?n2
選擇U1?和U2?中最小者與臨界值Uα?比較,當U < Uα時,拒絕H0,接受H1。
在原假設為真的情況下,隨機變量?U?的均值和方差分別為:
E(U)=n1*n2/2 D(u)=n1*n2*(n1+n2+1)/12
當n1?和n2?都不小于?10?時,隨機變量近似服從正態(tài)分布。
第四步:作出判斷。
設第一個總體的均值為 u1,第二個總體的均值為 u2,則有:
1)Ho:u1 ≤ u2,H1:u1 >u2 if Z< -Za, 拒絕 Ho;
2)Ho:u1 ≥ u2,H1:u1 < u2 if Z> -Za, 拒絕 Ho;
3)Ho: u1 = u2, H1:u1 != u2 if Z> -Za / 2,拒絕 Ho。

(5)Z檢驗:Z檢驗(Z Test)又叫U檢驗。由于實際問題中大多數(shù)隨機變量服從或近似服從正態(tài)分布,U作為檢驗統(tǒng)計量與X的均值是等價的,且計算U的分位數(shù)或查相應的分布表比較方便。通過比較由樣本觀測值得到的U的觀測值,可以判斷數(shù)學期望的顯著性,我們把這種利用服從標準正態(tài)分布統(tǒng)計量的檢驗方法稱為U檢驗(U-test)。



(6)克魯斯卡爾-沃利斯檢驗(Kruskal-Wallis test):克魯斯卡爾-沃利斯檢驗(Kruskal-Wallis test)亦稱“K-W檢驗”、“H檢驗”等。用以檢驗兩個以上樣本是否來自 同一個概率分布的一種非參數(shù)方法。被檢驗的幾個樣本必須是獨立的或不相關的。與此檢驗對等的參數(shù)檢驗是單因素方差分析,但與之不同的是,K-W檢驗不假設樣本來自正態(tài)分布。它的原假設是各樣本服從的概率分布具有相同的中位數(shù),原假設被拒絕意味著至少一個樣本的概率分布的中位數(shù)不同于其他樣本。此檢驗并未識別出這些差異發(fā)生在哪些樣本之間以及差異的大小。





(7)卡方分布:若n個相互獨立的隨機變量ξ?,ξ?,...,ξn ,均服從標準正態(tài)分布(也稱獨立同分布于標準正態(tài)分布),則這n個服從標準正態(tài)分布的隨機變量的平方和構成一新的隨機變量,其分布規(guī)律稱為卡方分布(chi-square distribution)。


(8)Fisher確切概率法:費希爾精確概率檢驗(Fisher's precision probability test),亦稱“四格表的確切概率法”。主要用于四格表資料各格中有一格理論次數(shù)小于 5 時的獨立性檢驗的方法。先將根據(jù)實際資料所列的四格表在邊緣次數(shù)不變的情況下,排出有一格次數(shù)為零的各種組合。
