R數(shù)據(jù)處理-卡方檢驗
卡方(χ2)檢驗
連續(xù)性數(shù)據(jù)的χ2指多個相互獨立的正態(tài)離差平方值的總和。
分布特點:
取值范圍為[0,∞)
平均數(shù)為μ
分布圖形為一組具不同自由度v值的曲線,自由度小時呈偏態(tài),隨著自由度增加,偏度降低,至+∞時,呈對稱分布。
適合性檢驗
指根據(jù)調(diào)查結果測驗未知總體是否符合已知理論規(guī)律的統(tǒng)計方法,也叫擬合優(yōu)度(goodness of fit)檢驗。
常見于次數(shù)分布資料的觀察次數(shù)與理論次數(shù)的分布。
獨立性檢驗
又叫次數(shù)資料的相依性檢驗,是檢驗兩個方向上數(shù)據(jù)資料的表現(xiàn)是相互獨立的還是相互影響的一種統(tǒng)計分析方法。
卡方檢驗的一般步驟
1.做出零假設
2.統(tǒng)計資料觀測次數(shù)和理論次數(shù)
3.計算χ2值和p值
4.進行統(tǒng)計推斷
適合性檢驗
1.假設現(xiàn)有大豆花色一對等位基因的遺傳研究,在F2獲得分離,產(chǎn)生紅花(AA)、粉色花(Aa)、白花(aa)三種表型。 分析基因F2群體分離情況(example5-1.csv)是否符合孟德爾分離比。
2.假設有一水稻遺傳試驗,以非糯品種與糯性品種雜交,其F2代性狀會按非糯(A1)和糯性(A2)分離(example5-2.csv)。根據(jù)觀測結果推測糯性性狀的遺傳模式。?
①一對基因控制,3:1?
②兩對基因隱性抑制, 9:7?
③兩對基因顯性互補, 15:1
獨立性檢驗
假設有460粒小麥種子,現(xiàn)調(diào)查其是否經(jīng)過滅菌處理及發(fā)生散黑穗病的情況(example5- 3.csv)。分析種子是否滅菌(A1、A2)與是否發(fā)生散黑穗病穗(B1、B2)有關。
適合性檢驗-遺傳群體偏分離和雜合度檢驗
假設現(xiàn)有一個玉米重組自交系F6群體,共192個株系,現(xiàn)取其第1染色體上前20個SNP標記基因型,0為缺失,1為AA,2為TT,3為雜合AT(example5-4.csv)。試估計這20個SNP標記的偏分離和雜合度情況是否符合理論值。
獨立性檢驗-基因型與性狀關聯(lián)分析
假設有約500個玉米自交系,玉米棒子軸色存在紅軸(1)和白軸(0)分離,已知控制玉米軸色的基因p1在第1染色體?,F(xiàn)有通過Golden Gate芯片獲得的SNP基因型數(shù)據(jù)(example5-5-1.csv)和自交系的軸色數(shù)據(jù)(example5-5-2.csv)。是通過統(tǒng)計方法(case-control association)估計軸色基因p1的大致位置。