R語言進(jìn)行單倍型分析
注:第一次發(fā)布時(shí),自定義函數(shù)的代碼塊被吞了,2月15日補(bǔ)上了。
GWAS分析得到QTN后,需要鑒定已知基因和挖掘候選基因。單倍型分析可以用于驗(yàn)證所得到的的候選基因是否可靠。
單倍型分析的大致思路是:遍歷候選基因表,對于其中的每一行,提取該基因范圍內(nèi)的SNP,結(jié)合其對應(yīng)的表型數(shù)據(jù)集,進(jìn)行方差分析。
提取SNP這一步可以用plink進(jìn)行,以提取1號染色體的10000到15000位點(diǎn)之間的SNP為例,指令如下。
plink處理只適用于候選基因較少且有plink格式基因型文件的情況。(或許也可以批量處理,但我不會(huì))
候選基因很多,或者不能轉(zhuǎn)換得到plink格式時(shí),可以直接使用R處理。

下面演示可用于單倍型分析的兩個(gè)函數(shù)內(nèi)容以及使用方法。
已經(jīng)得到候選基因?qū)?yīng)的SNP數(shù)據(jù)、表型數(shù)據(jù)時(shí),可只使用haplo1_single或haplo1_meja函數(shù),然后對得到的數(shù)據(jù)框使用aov函數(shù)即可;如果沒有,可以使用haplo2函數(shù)來處理得到上述數(shù)據(jù),將直接輸出多個(gè)包含方差分析結(jié)果的列表。
single為單環(huán)境分析,meja為多環(huán)境聯(lián)合分析(Multi-environment joint analysis)。