基于R語言進行單因素方差分析
在對數(shù)據(jù)進行基礎的統(tǒng)計分析過程中,單因素方差分析(one-way analysis of variance)是比較常用的一種分析手段,一般我們要比較試驗觀測值的某個因變量(稱為“指標”)按照一個分組變量(稱為“因素”)分組后, 各組的因變量均值有無顯著差異。今天,小編給大家展示的內(nèi)容就是如何基于R語言進行單因素方差分析。
R包加載及數(shù)據(jù)加載

由于后續(xù)數(shù)據(jù)分析的需要,將數(shù)據(jù)轉(zhuǎn)換為長格式:

單因素方差分析
基于aov()函數(shù)進行方差分析:

主效應x(分組)的F檢驗的p值為1.26e-07, 檢驗水平為0.05情況下則分組效應顯著, 各組之間有顯著差異。基于箱線圖進行初步展示

從箱線圖來看,A組和D組之間以及B組和C組之間沒有顯著差異, A組與B組、C組之間均有顯著差異,B組和C組與D組之間有顯著差異。
多重比較
為了找到各組兩兩之間是否有顯著差異,可以進行兩兩的獨立兩樣本t檢驗,但這樣不能利用共同的模型參數(shù),進行多次重復檢驗也會使得總第一類錯誤概率變得比較高, 發(fā)生過度擬合。為此,可以進行一些調(diào)整, 使得報告的檢驗p值能夠控制總第一類錯誤概率。multcomp包的glht()函數(shù)可以對方差分析結(jié)果進行多重比較并控制總錯誤率,一種方法是利用Tukey的HSD(Honest Significant Difference)方法, 程序如下:

Tukey HSD檢驗的結(jié)果顯示在0.05水平下, A和D,B和C沒有顯著差異, A與B、C均有顯著差異,B及C和D有顯著差異,這與之前箱線圖顯示結(jié)果一致;
方差不相等情形#方差分析模型要求誤差項獨立同正態(tài)分布,這意味著各組的因變量方差相等。?#實際中不同組的因變量可能有不同的方差。?#R中oneway.test()函數(shù)可以不要求方差相等,是一種獨立兩樣本t檢驗的Welch方法推廣。

#p值為3.155e-06,說明在0.05水平下極顯著, 說明四組有顯著差異。#多重比較——進行兩兩t檢驗并不使用合并的標準差估計, 使用Holm方法進行p值調(diào)整以控制總錯誤率:

#在0.05水平下, A和D、B和C沒有顯著差異,A與B、C均有顯著差異,B及C和D有顯著差異,這與之前箱線圖顯示結(jié)果也一致;
非參數(shù)方差分析
#如果各組的因變量(指標)分布嚴重偏離正態(tài), 則單因素方差分析所依據(jù)的F檢驗會有很大的誤差,這時可以使用非參數(shù)方法,Kruskal-Wallis檢驗就是獨立兩樣本比較的Wilcoxon秩和檢驗的推廣。

#Kruskal-Wallis檢驗p值為0.002,所以在0.05水平下拒絕原假設,認為各組之間有顯著差異。
參考:https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/stat-aov.html#stat-aov-1w-multc