簡單到哭!一文教你get【衛(wèi)統計算題分析思路】!

流統計算題集訓營開展至今
相信大家的解題速度和技巧都有所提高
這些知識點你掌握沒有~
很多考研兒對統計推斷中的如何對不同資料的假設檢驗方法進行選擇,到現在還是傻傻分不清楚。
現在跟著小衛(wèi)一起攻克它吧!


假設檢驗中的統計推斷通常考察題型為綜合分析類題目,需要同學綜合考慮多方面的因素之后選出合理的假設檢驗方法。
? 判別檢驗方法主要通過:
①資料類型、②研究目的、③對比組數、④研究設計類型、⑤數據分布特征及樣本量五個步驟。


▲ 圖1 定量資料5步分析步驟

? 表1和表2總結了常用的假設檢驗與關聯性分析方法。掌握這兩張表,統計分析將不再復雜!



??小試牛刀
*題目及解析來源于集訓營-20天帶過計算題。
將19只雌性大白鼠隨機分為2組,分別喂以高蛋白和低蛋白飼料8周,各鼠體重的增加克數如下。不同飼料組大白鼠的增重有無差別?(寫出假設檢驗和計算公式,不需要計算)
●?高蛋白組(X1) :?134, 146, 104, 119, 124, 161, 107, 83, 113, 129, 97, 123
●?低蛋白組(X2) :?70, 118, 101, 85, 107, 132, 94
>>>分析<<<
? 第一步:審題、鎖定題眼→給出什么?直接條件+隱含條件
???第二步:分析、匹配所學→想要什么?
??第三步:作答、簡要清晰→精準答案?


??題目解析
①由題可知,資料類型為定量資料,實驗設計為完全隨機設計,研究目的是對兩個樣本來自的兩個獨立總體的均值是否有差異進行推斷,需進行兩獨立樣本定量資料的假設檢驗。
②兩獨立樣本定量資料的假設檢驗可考慮用t檢驗、秩和檢驗、z檢驗,本組資料樣本量較小、從檢驗效能角度優(yōu)先選擇成組t檢驗,但t檢驗需滿足獨立、正態(tài)、方差齊三個條件。一般來說,資料的獨立性是由抽樣方式決定的,因此主要考察資料的正態(tài)性和方差齊性。
③總體思路:對兩獨立樣本定量資料進行假設檢驗,當資料滿足正態(tài)性(或樣本量較大),方差齊性時,選用t檢驗;
● 如果兩獨立樣本總體方差不齊,但兩組資料服從正態(tài)性(或樣本量較大),用t'檢驗;
●?如果資料不滿足方差齊性、正態(tài)性的條件,可用Wilcoxon秩和檢驗。

??具體步驟如下:
第一步:正態(tài)性檢驗。
①立檢驗假設,確定檢驗水準建
H0:資料服從正態(tài)分布。
H1:資料不服從正態(tài)分布。
α=0.05
②正態(tài)性檢驗的方法很多,可以選用 Shapiro-Wilk正態(tài)性檢驗、擬合優(yōu)度檢驗。
③確定P值,作出結論
●當P>α,按α=0.05的水準不拒絕H0,資料服從正態(tài)分布。
●當P<α,按α=0.05的水準拒絕H0,資料不服從正態(tài)分布。
第二步:判斷資料對應的總體方差是否相等,進行方差齊性檢驗。
①建立檢驗假設,確定檢驗水準
H0:兩總體方差相等
H1:兩總體方差不相等
α=0.1?
②本題是兩組方差的比較,且不確定原始數據是否是正態(tài)分布,故選用Levene檢驗。
③確定P值,作出結論
●當P>α,按α=0.05的水準不拒絕H0,兩總體方差相等。
●當P<α,按α=0.05的水準拒絕H0,兩總體方差不等。

第三步:選擇檢驗方法
1、兩獨立樣本均數比較的t檢驗和t’檢驗詳細步驟
①建立檢驗假設,確定檢驗水準
● H0: μ1 = μ2,高蛋白組合低蛋白組大白鼠的體重增量總體均數相同;
● H1:?μ1≠μ2,高蛋白組合低蛋白組大白鼠的體重增量總體均數不同。
②計算檢驗統計量
● 若兩總體方差齊

● 若兩總體方差不齊,使用t’統計量

③確定P值,作出結論
● 當P>α,按α=0.05的水準不拒絕H0,高蛋白組合低蛋白組大白鼠的體重增量總體均數相同;
● 當P<α,按α=0.05的水準拒絕H0,高蛋白組合低蛋白組大白鼠的體重增量總體均數不同。
2、Wilcoxon秩和檢驗步驟。
①建立假設,確定檢驗水準
H0:兩總體分布相同;
H1:兩總體分布不同。
檢驗水準α=0.05。
②編秩,求秩和,確定統計量T
將兩組原始數據混合由小到大排序編秩,遇到相同的數據,取平均秩次。分別將兩組的秩次相加,得到兩組的秩和T1和T2。
● 如兩組樣本含量不等,以樣本含量較小組的秩和作為統計量T;
● 如兩組樣本量相等,任取一組秩和作為統計量T。
③確定P值范圍,得出結論
??查表法:當n1 ≤ 10,且n2 - n1 ≤ 10,可根據n1和n2-n1查T界值表。
● 如果統計量T等于T界值或在T界值范圍外,P?≤ 0.05,拒絕H0,認為兩總體分布不同。
● 如果統計量T在T界值范圍之內,P>0.05,不拒絕H0,尚不能認為兩總體分布不同。
??正態(tài)近似法:當n1 > 10,且n2 - n1 > 10,超出T界值表范圍,這時統計量T近似服從總體均數為n1(N+1)/2,方差為n1n2(N+1)/12的正態(tài)分布,由于秩為離散性數據,正態(tài)分布為連續(xù)型分布,需進行連續(xù)性校正,并用正態(tài)近似法,計算正態(tài)分布統計量Z確定P值。當存在較多的相同觀察值同秩時,需對Z值校正,計算Zc。
● 如果Z ≥ Z0.05/2?= 1.96,P ≤ 0.05
拒絕H0,認為兩總體分布不同。
● 如果Z<Z0.05/2?= 1.96,P>0.05
不拒絕H0,尚不能認為兩總體分布不同。
