科研代碼分享|用R語言對表達譜樣本做PCA分析
科研有捷徑,輸入代碼,一鍵獲取科研成果!就是這么省事,來具體看下有多方便!
搜索http://985.so/a9kb查看全部代碼(目前共計50+持續(xù)新增中),也可以點擊右側(cè)【目錄】,可以看到更多有趣的代碼
真香提示:文末可以知道如何獲取代碼~?
主成分分析(Principal component analysis, PCA)是一種數(shù)學(xué)算法,它可以在減少數(shù)據(jù)維度的同時,保留數(shù)據(jù)集中絕大多數(shù)的變量[1]。
PCA通過對主成分進行辨別,找出一個方向,并沿此方向分布的數(shù)據(jù)為最大值,從而減少數(shù)據(jù)維度。通過采用這樣的主成分,便可以只選用若干變量而不是上千的變量來對一種樣品進行分析了。
這樣,就可以將樣品有關(guān)變量繪制成圖,使得樣品間的相似性和相異之處一目了然,對不同樣品是否可以歸為一組,也一清二楚。這里我們主要解析如何利用R語言,基于表達譜中基因的表達值做PCA分析,并輸出三維的PCA結(jié)果圖。
1.?在線安裝并加載rgl包
source("http://bioconductor.org/biocLite.R")
biocLite(“rgl”)
library(rgl)
2.?輸入表達譜數(shù)據(jù)(示例以一組隨意獲得的表達譜中的表達譜值為例)

A=read.table("e:/diff-exp-zhuan.txt",header=T)
#輸入表達譜數(shù)據(jù),注意這里基因數(shù)目一定不能少于樣本數(shù)目
B=as.data.frame(scale(A[2:21]))
#指定參與做PCA分析的數(shù)據(jù)
3.?用之前指定的數(shù)據(jù)做PCA分析
pca <- prcomp(B)
summary(pca)
結(jié)果:將組成成分的信息均展示出:

4.?畫出前三個PC為軸的PCA三維圖(此處可根據(jù)研究目的等需求來選取需要的PC來指定根據(jù)哪三個PC來畫圖)
colour<-c(rep("gray",10),rep("orange",10))
plot3d(pca$x[,1:3],col=colour,type="s",radius=0.35,font.lab=2)

此圖在R上畫出后,可以根據(jù)最后輸出圖形的角度,用單擊鼠標左鍵的方式在頁面上進行旋轉(zhuǎn),得到不同視覺角度的圖。
這樣,根據(jù)輸入的基因的表達值的PCA分析與PCA立體結(jié)果圖就完成了,很簡單吧?趕快試試。
搜索http://985.so/a9kb查看全部代碼(目前共計50+持續(xù)新增中),也可以點擊右側(cè)【目錄】,可以看到更多有趣的代碼