GWAS的meta分析:控制假陽的常見手段之一
相信各位在學(xué)習(xí)GWAS原理時(shí)對GWAS的作圖群體有了一定的了解,在林木、農(nóng)作物等生長時(shí)間較長的物種來說,構(gòu)建子代、RIL甚至NAM群體需要較長的時(shí)間,在群體構(gòu)建完成之前,GWAS是少有的自然群體適合做的分析之一。盡管如此,受限于自然群體的特性,自然群體無法獲得明確的譜系,一般都是通過基因型PCA確定親緣關(guān)系,減少假陽性。因此當(dāng)群體出現(xiàn)分層時(shí),常規(guī)手段是將分層的群體獨(dú)立進(jìn)行分析,最后再做meta分析。
1.如何判斷群體是否分層
首先使用plink計(jì)算PCA,具體方法詳見小云以往公眾號。
繪制出不同群體PC1、PC2的雙標(biāo)圖后,就可以觀察群體之間是否明顯分開,如果群體明顯分層了,需要單獨(dú)進(jìn)行關(guān)聯(lián)分析,最后在做meta分析。
2.如何做meta分析
這里小云推薦使用metal進(jìn)行meta分析,原因當(dāng)然是簡單好用,還有windows版呢。下載鏈接如下:
http://csg.sph.umich.edu/abecasis/metal/download/
metal支持三個(gè)平臺,小云這里還是以最常見的Linux舉例,下載命令如下:
wget?http://csg.sph.umich.edu/abecasis/metal/download/Linux-metal.tar.gz
解壓軟件:
tar -zxvf Linux-metal.tar.gz
分析的文件來源于metal的示例數(shù)據(jù),解壓后的文件夾中包含兩個(gè)示例文件,咱使用./generic-metal/examples/GlucoseExample下的數(shù)據(jù)進(jìn)行演示
示例文件中運(yùn)行meta分析的文檔分別為DGI_three_regions.txt和magic_SARDINIA.tbl,
DGI_three_regions.txt如下所示

magic_SARDINIA.tbl如下所示

運(yùn)行分析前需要準(zhǔn)備一個(gè)metal.txt文件,如下圖所示

其中MARKER對應(yīng)的是DGI_three_regions.txt文檔的SNP列名;
WEIGHT對應(yīng)的是DGI_three_regions.txt文檔的SNP列名;
?
其他的以此類推;相當(dāng)于metal分析的config文件。
?
運(yùn)行代碼
metal metal.txt
?
進(jìn)行meta分析,meta分析后會(huì)生成兩個(gè)文件,分別是METAANALYSIS1.TBL和 METAANALYSIS1.TBL.info
?
其中METAANALYSIS1.TBL 是meta分析的結(jié)果文檔;

咱們一般主要專注meta分析后的pvalue。
?
METAANALYSIS1.TBL.info文件主要是對METAANALYSIS1.TBL的注釋,感興趣的可以仔細(xì)閱讀。

好啦,meta分析到這就結(jié)束了,關(guān)注小云,小云帶你學(xué)習(xí)更多生信分析。

