R數(shù)據(jù)分析-f測驗(yàn)
方差分析的意義
單個(gè)或兩個(gè)樣本的樣本平均數(shù)檢驗(yàn)常用u或t檢驗(yàn),但一般不在兩個(gè)以上樣本平均數(shù)的比較中使用t檢驗(yàn)的方法。
① t檢驗(yàn)要進(jìn)行兩兩比較,若在多樣本中進(jìn)行則過于繁瑣;
② t檢驗(yàn)無統(tǒng)一的試驗(yàn)誤差,誤差估計(jì)的準(zhǔn)確性與檢驗(yàn)靈敏性低;
③ t檢驗(yàn)增大犯α錯(cuò)誤的概率。
綜上,多個(gè)平均數(shù)的差異顯著性檢驗(yàn)不適合用t檢驗(yàn),需要使用方差分析法(analysis of variance, ANOVA)。
方差分析的一般步驟
① 平方和與自由度的分解
② 列出方差分析表,作F測驗(yàn)
③ 若F檢驗(yàn)顯著,則進(jìn)行多重比較
④ 結(jié)果的解釋/說明
常用lm()和aov()函數(shù)分析ANOVA模型。
formula中可使用特殊符號(hào)(y是因變量,字母 A,B,C是因子自變量)。
~ 分隔符號(hào),左邊為因變量,右邊為自變量, 如y~A
+?自變量分隔符,如y~A+B
: 變量交互項(xiàng),如y~A+B+A:B
*?表示所有可能交互項(xiàng),如y~ABC等同于 y~A+B+C+A:B+A:C+B:C
. 表示除因變量外,數(shù)據(jù)框中所有的變量。
單因素方差分析
假設(shè)現(xiàn)作水稻施肥的盆栽試驗(yàn),有5種施肥方式,每種方式各處理4盆。20盆水稻的稻谷產(chǎn)量列于example4-1.csv,試測驗(yàn)各處理平均數(shù)的差異顯著性。
雙因素方差分析
玉米開花期調(diào)控通路中,MADS69通過激活ZCN8基因的表達(dá),從而促進(jìn)開花。現(xiàn)有 MADS69和ZCN8啟動(dòng)子區(qū)的某個(gè)SNP基因型,以及ZCN8基因在玉米苗期的表達(dá)量豐度,列于example4-2.csv。利用雙因素方差分析,檢驗(yàn)該SNP位點(diǎn)的互作是否會(huì)影響ZCN8基因表達(dá)。