富集不到想要的功能?別放棄呀,試試這個方法!
科研有捷徑,輸入代碼,一鍵獲取科研成果!就是這么省事,來具體看下有多方便!
搜索http://985.so/a9kb查看全部代碼(目前共計50+持續(xù)新增中),也可以點擊右側【目錄】,可以看到更多有趣的代碼;真香提示:文末可以知道如何獲取代碼~ 作者:爾云間 https://www.bilibili.com/read/cv17906772 出處:bilibili
? ? ? 功能富集是生信分析中最常用也是十分關鍵的一步,基因功能的富集分析已成為高通量組學數(shù)據(jù)分析的常規(guī)手段,對于揭示生物醫(yī)學分子機制具有重要意義。功能富集分析可以將成百上千個基因、蛋白或者其他分子分到不同的通路中,以減少分析的復雜度。另外,在不同實驗條件下,激活的通路顯然比簡單的基因或蛋白列表更有說服力。
? ? ? 但是在我們分析的過程中,像GO,KEGG是我們用的比較多的功能富集方法,有時候卻富集不到我們想要的通路結果。今天我們來介紹另一種功能富集方法-GSEA。GSEA(Gene?Set?Enrichment?Analysis):基因集富集分析,由Broad?Institute研究所提出的一種富集方法,同時還提供對應的分析軟件GSEA和一個基因集數(shù)據(jù)庫MSigdb?(https://www.gsea-msigdb.org/gsea/msigdb/)。今天我們來介紹下如何具體實現(xiàn)GSEA功能富集分析:
? ? ? ?本文代碼及相關文件見如下3個文件夾,可在文末咨詢小助手領取

加載相應R依賴包:
library(GSEABase)
library(clusterProfiler)
library(DOSE)
library(org.Mm.eg.db)
library(ggplot2)
library(enrichplot)
library(stringr)
2. 數(shù)據(jù)導入
輸入數(shù)據(jù)包含2列,一列是p值,一列是logFC值,具體見下圖。

3. GSEA分析
接下來對輸入數(shù)據(jù)進行分析,第一步將基因symbol轉成ENTREZID,這樣才能將ID對應到數(shù)據(jù)庫中。

第二步將轉換好的基因ID與log2FC值一一對應,并將log2FC值反向排序。

? ??第三步我們先使用clusterProfiler包中gsea分析函數(shù)自帶的KEGG庫試一下,這里使用的是小鼠的基因,所以organism選mmu。


4, 自定義基因集
接下來我們自己選擇基因集來做GSEA富集,這就是與常規(guī)的GO,KEGG有區(qū)別的地方,讓GSEA分析的結果更理想一點。首先需要準備gmt文件,人的可以去這里下載相應的基因集https://www.gsea-msigdb.org/gsea/msigdb/index.jsp,小鼠可以去這里下載http://download.baderlab.org/EM_Genesets/current_release/Mouse/symbol/。


? ??到這里分析就結束了,最后的圖我們選擇了前4個通路作為展示,是可以任意展示想要的通路哦!
如需代碼及示例數(shù)據(jù)等文件,請掃碼聊天框回復 “B33”領取!?
