R|利用rTASSEL進(jìn)行全基因組關(guān)聯(lián)分析(四)
上節(jié)回顧:數(shù)據(jù)前處理,過(guò)濾最小等位基因頻率≤0.05的SNP位點(diǎn)。
本節(jié)主要內(nèi)容是:利用rTASSEL對(duì)自己的數(shù)據(jù)進(jìn)行全基因組關(guān)聯(lián)分析。
一、從路徑讀取數(shù)據(jù)
基因型數(shù)據(jù)的首行和基因型數(shù)據(jù)如下:



*共238份樣品,97276個(gè)SNP位點(diǎn)。
二、數(shù)據(jù)過(guò)濾

*可以看到數(shù)據(jù)過(guò)濾后剩57227個(gè)SNP位點(diǎn)【這里缺失率依據(jù)樣本自行調(diào)整】
三、計(jì)算親緣關(guān)系

四、計(jì)算混合線性模型(MLM)
五、數(shù)據(jù)結(jié)果可視化繪制曼哈頓圖(Manhattan)
注:這里一開(kāi)始使用rTASSEL中的內(nèi)置包繪制曼哈頓圖踩了一個(gè)坑,是自己數(shù)據(jù)的問(wèn)題。


很好,自己的數(shù)據(jù)成功白屏。9w SNP還是挺大數(shù)據(jù)的。
換種思路,讓他直接導(dǎo)出到PDF文檔中。

*額……一開(kāi)始以為是數(shù)據(jù)量太大。后來(lái)想起自己文件的Chr數(shù)據(jù)直接是基因,而不是染色體。

那咱就直接導(dǎo)出數(shù)據(jù)包,然后手動(dòng)進(jìn)行修改哈。不要難為自己,一碼到底。
導(dǎo)出后的數(shù)據(jù):

修改后數(shù)據(jù),直接保留作圖需要的四列即可。


?后邊就可以尋找具顯著關(guān)聯(lián)的染色體和位點(diǎn)啦!

預(yù)告:
1.???? CMplot、qqman代碼簡(jiǎn)介。
2.???? 對(duì)hmp文件進(jìn)行修改。(這里使用自己的數(shù)據(jù)進(jìn)行分析時(shí)出現(xiàn)的問(wèn)題)
3.???? 修改曼哈頓圖繪制數(shù)據(jù)中的染色體一列。使用qqman染色體位置需要用數(shù)字類型,像小麥這種染色體命名為1A、1B、1D的命名方式需要修改成1、2、3才可以用qqman作圖。
……【后續(xù)想起來(lái)再補(bǔ)充】
?

【最復(fù)雜的代碼,做最簡(jiǎn)單的事?!?