模式生物也能看功能,非人物種的富集分析
爾云間? 一個(gè)專門做科研的團(tuán)隊(duì)
? ?

富集分析是我們科研分析中常見的一種分析方式,人的分析過程已經(jīng)很清楚了,而且有在線工具可以意見富集,但一些非人物種,還需要借助一些代碼來完成,富集分析中較常見的就是clusterProfiler,下面就讓我們以小鼠為例,來看看富集分析是怎么做的吧。

代碼如下:
library(clusterProfiler) #加載程序包
library(org.Mm.eg.db)
dif_enrich<- read.table("T2DMvsCon.txt",header = T,row.names = 1,sep = "\t")
#讀取表達(dá)文件
gene <- rownames(dif_enrich)# 轉(zhuǎn)為向量
## 將gene symbol轉(zhuǎn)換為Entrez ID
?gene.id <- bitr(gene, fromType="SYMBOL", toType="ENTREZID", OrgDb="org.Mm.eg.db")
#org.Mm.eg.db包里記載了小鼠基因ID的對(duì)應(yīng)關(guān)系
?egoBP<-enrichGO(gene = gene.id$ENTREZID,? pAdjustMethod ="none",?? ?
????????????????????????????????? OrgDb = 'org.Mm.eg.db',???????? ?
????????????????????????????????? ont = "BP",? #GO富集有多種分類,其中最重要的就是BP,也就是生物學(xué)過程,還可以選擇MF分子功能和CC細(xì)胞結(jié)構(gòu)。如果全都要的話可以選擇ALL
????????????????????????????????? pvalueCutoff = 0.05, #P小于0.05,即為顯著富集,這里的設(shè)置就是只保留顯著富集的結(jié)果,如果想把不顯著的也都保存下來,這里可以選擇把0.05改成1
????????????????????????????????? qvalueCutoff=1,
????????????????????????????????? minGSSize = 10,
????????????????????????????????? readable= TRUE)??? ?
?summary(egoBP)? # 結(jié)果展示
?bp2 <- simplify(egoBP, cutoff=0.7, by="p.adjust", select_fun=min) #對(duì)富集到的GO項(xiàng)進(jìn)行簡(jiǎn)化處理。
?write.table(summary(bp2), "GO.BP.txt", sep="\t") #將富集結(jié)果寫入文件
?pdf("GO.bp.pdf",height=8,width=8)
??? barplot(bp2, showCategory=8) #條形圖 showCategory這個(gè)參數(shù)是用來控制顯示的GO項(xiàng)的數(shù)量的,默認(rèn)是10,具體數(shù)量可根據(jù)需要來調(diào)整
?dev.off()
?pdf("GOdot.bp.pdf",height=8,width=8)
??? dotplot(egoBP)#氣泡圖
?dev.off()

egoPathway<-enrichKEGG(gene = gene.id$ENTREZID, organism = "mmu", pvalueCutoff = 0.05,pAdjustMethod ="none",minGSSize =2,qvalueCutoff = 1)??? #KEGG富集,與GO富集類似,mmu代表小鼠
?summary(egoPathway)? # 結(jié)果展示
?pdf("pathway.pdf")
??? barplot(egoPathway, showCategory=8)
?dev.off()
?pdf("pathwaydot.pdf")
??? dotplot(egoPathway)
?dev.off()

今天就分享到這里了,代碼還是比較簡(jiǎn)單的,小伙伴們有什么問題的話歡迎來和小果分享討論喲。
shengxinguoer
生信果
生信硬核知識(shí)解答
和小果一起學(xué)生信