R數(shù)據(jù)處理-t測驗
假設(shè)檢驗
定義
又稱顯著性測驗,指根據(jù)總體或樣本參數(shù),提出假設(shè)(H0和HA,通常構(gòu)成完全事件系),在H0假設(shè)下,計算樣本觀測值發(fā)生的概率,從而做出判斷。
常用方法
u檢驗、t檢驗、F檢驗和卡方檢驗。
基本理論依據(jù)
理論分布、小概率不可能性原理。
小概率不可能性原理:在一次試驗中,概率很小的事件實際上是不可能發(fā)生的。(第一類錯誤 / 假陽性 α ;第二類錯誤 / 假陰性 β )
步驟
① 根據(jù)總體和樣本參數(shù),提出無效假設(shè)
② 確定一個否定H0成立的概率 (α?)?
③ 計算H0在1-α下成立的接受域,或H0成 立的概率p?
④ 做出統(tǒng)計推斷并對此加以解釋
單樣本t檢驗
推斷該樣本來自的總體平均數(shù)μ與已知的某一總體均數(shù)μ0(常為理論值或標(biāo)準(zhǔn)值)有無顯著差別。
假設(shè)某水稻品種A千粒重為34g,現(xiàn)對另一新品種的千粒重進行100次測量,結(jié)果列于examp3-1.csv。
檢驗新品種的千粒重是否顯著高于A?
多組數(shù)據(jù)t檢驗
假設(shè)某水稻品種A的千粒重為34g,現(xiàn)對另三個新品種的千粒重進行100次測量,結(jié)果列于example3-2.csv。
檢驗三個新品種的千粒重是否顯著高于A 5%?另輸出三個新品種的平均數(shù)、標(biāo)準(zhǔn)差、t統(tǒng)計數(shù)。
成對數(shù)據(jù)t檢驗
兩組樣本應(yīng)一一對應(yīng),一對數(shù)據(jù)來源于實驗條件基本一致的小區(qū)。
假設(shè)現(xiàn)要研究某肥料能否比原肥料每畝增產(chǎn)5kg以上皮棉,選各條件最近似的相鄰小區(qū)組成一對,其中一區(qū)(x1)施新肥料,另一區(qū)施原肥料作對照(x2),重復(fù)9次。產(chǎn)量結(jié)果見example3-3.csv。
檢驗新肥料能否比原肥料每畝增產(chǎn)10斤以上皮棉?
研究發(fā)現(xiàn),基因的表達豐度主要受基因附近變異的順式調(diào) 控?,F(xiàn)有418個玉米品種,經(jīng)RNA-seq獲取了四個開花期基因 MADS69、ZCN8、myb74和Rap2.7的表達譜數(shù)據(jù)( example3-4-2.csv),并檢測了每個基因啟動子區(qū)的一個核苷酸變異基因型(example3-4-1.csv)。
檢驗啟動子區(qū)的該核苷酸突變是否會顯著影響該基因本身的表達量?