GCTA或R語言進行PCA主成分分析
主成分分析即PCA (Principal Component Analysis),不講概念,我技藝不精,講也講不明白,可以看看這一篇講解——《一文讀懂主成分分析(PCA)》(https://mp.weixin.qq.com/s/1ER6p8eB8Le2UvInO6JPKQ)。
GWAS中,可以用PCA的分析結(jié)果代替群體結(jié)構(gòu)結(jié)果進行關(guān)聯(lián)分析。
可以做PCA的工具很多,比如GCTA、R語言的prcomp函數(shù)、tassel、gapit,后兩個我沒用過,記錄一下前兩種的方法。
注意兩種方法都需要用到plink。
GCTA
1.安裝
2.分析
3.可視化
這里的腳本畫出來的是兩兩比對的圖,例如主成分取3的話就會有三張圖。
不推薦這么畫,一般應(yīng)該把所有個體畫在一張圖里+標注置信橢圓+上色(上色除了出于美觀考慮,也是為了更容易區(qū)分不同主成分;如果結(jié)果不夠好又不上色區(qū)分,畫出來的圖可能很難辨別)。
但我不會,嘿嘿
R的prcomp函數(shù)
師姐說這個方法靠譜一點。
1.處理前置文件
2.分析
后面需要再稍微手動處理一下文件就可以
TASSEL
操作特別簡單,在tassel里打開plink格式文件,點擊analysis - relatedness - PCA,然后等著出結(jié)果就行。
不過tassel運行慢得出奇,而且我還報錯。之前是在macOS操作的,當時一直提示堆越界,看不懂什么意思。
在網(wǎng)上搜到了解決辦法,雖然最終還是沒解決但先貼在這里,改天用windows系統(tǒng)再試一遍。
沒啦,干飯去咯
標簽: