最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

十分鐘GSEA從原理到繪圖

2023-11-10 09:33 作者:爾云間  | 我要投稿

GSEA(Gene Set Enrichment Analysis)是一種用于分析基因表達數(shù)據(jù)的計算方法,旨在揭示基因集在特定生物學過程或疾病中的功能富集情況。它是一種廣泛應用于生物信息學和系統(tǒng)生物學研究的工具。 GSEA的基本原理是通過將基因根據(jù)其表達模式進行排序,然后計算預定義的基因集在排序列表中的富集程度。這些基因集可以是與特定生物學過程、細胞信號通路、疾病相關的基因集合,或者是來自公共數(shù)據(jù)庫(如基因集富集分析數(shù)據(jù)庫)中的已知基因集。通過比較基因集在排序列表中的富集程度,可以確定哪些基因集與研究興趣相關。GSEA的優(yōu)點在于它不僅考慮單個基因的表達變化,而且關注整個基因集的富集情況。這種方法對于研究復雜的生物學過程和疾病機制非常有用,因為它能夠捕捉到多個基因的協(xié)同調控和功能相關性。

小果有話要講:在進行繪圖的過程中,漂亮的圖形是次要的,正確的分析才是重要的一環(huán)。

GSEA實踐

1、加載安裝各種包

rm(list = ls()) devtools::install_github("nicolash2/gggsea") BiocManager::install("GSVA") BiocManager::install("enrichplot") BiocManager::install("GSEABase") BiocManager::install("clusterProfiler") library(gggsea) library(ggplot2) library(GSVA) library(enrichplot) library('GSEABase') library(clusterProfiler) 2、

基因排序信息

#數(shù)據(jù)的準備至少包含兩列為logFC和SYMBOL ID,根據(jù)logFC排序。 deg<- read.csv("/Users/sansan/Desktop/軟文/deg.csv",header = T,na.strings = T)#這里選擇合適的方法read.delim()或者read.table()進行倒入數(shù)據(jù)。 alldiff <- deg[order(deg$logFC,decreasing = T),] id <- alldiff$logFC names(id) <- alldiff$gene_name#這里需要填入你存儲genename的列

3、

下載合適的數(shù)據(jù)集

一些已經(jīng)預定義的功能基因集可以在http://www.gsea-msigdb.org/gsea/msigdb/index.jsp中下載,自定義基因集需要有較強的背景知識。 根據(jù)自己的需求進行下載~

點擊進去后會出現(xiàn)下面的頁面~ 這里有兩個版本,需要根據(jù)自己的需求進行選擇性的下載,這里的genename為symbols形式,所以小果下載的為c2的symbols的格式的哦~

4、導入分析

gmtfile <- "/Users/sansan/Downloads/c2.all.v2023.1.Hs.symbols.gmt.txt" hallmark <- read.gmt(gmtfile) gsea.re1<-clusterProfiler::GSEA(id,TERM2GENE=hallmark,verbose = T) #clusterProfiler::GSEA()這個函數(shù)可以?clusterProfiler::GSEA查看一下幫助,會獲得更多的參數(shù),例如可以調控的參數(shù),詳細的解釋見附件 #這一步是分析的主要步驟,分析結束后,會出現(xiàn)下面的字樣 ? g1<-as.data.frame(gsea.re1) g1<-g1[order(g1$NES,decreasing = T),] 5、

出圖

gseaplot2(gsea.re1,geneSetID = rownames(g1)[1], ??????????title = "sample",#標題 ??????????base_size = 9.5,#大小尺寸 ??????????rel_heights = c(1, 0.2, 0.4),#小圖相對高度 ??????????subplots = 1:3,#展示小圖 ??????????pvalue_table = FALSE,#p值表格 ??????????ES_geom = "line"#line or dot ) #輸出單個的

#展示多個基因集 num=3 gseaplot2(gsea.re1,geneSetID = rownames(g1)[1:num], ??????????title = "sample",#標題 ??????????color = col_gsea1[1:num2],#顏色 ??????????base_size = 9.5,#大小尺寸 ??????????rel_heights = c(1, 0.2, 0.4),#小圖相對高度 ??????????subplots = 1:3,#展示小圖 ??????????pvalue_table = FALSE,#p值表格 ??????????ES_geom = "line"#line or dot

繪圖函數(shù)的參數(shù): gseaplot2( ??x, ??geneSetID, ??title = "", ??color = "green", ??base_size = 11, ??rel_heights = c(1.5, 0.5, 1), ??subplots = 1:3, ??pvalue_table = FALSE, ??ES_geom = "line" ) ? 附件: 在R中,clusterProfiler包中的GSEA()函數(shù)用于進行基因集富集分析。該函數(shù)提供了一些參數(shù),可以用來調整篩選條件和擴大篩選范圍。 下面是一些常用的參數(shù)和選項: minGSSize:設置最小基因集大小。默認值為 10。你可以增加該值來篩選更大的基因集。 maxGSSize:設置最大基因集大小。默認值為 Inf(無窮大)。你可以減小該值來篩選更小的基因集。 pvalueCutoff:設置顯著性水平的閾值。默認值為 0.05。你可以增大該值來篩選更顯著的基因集。 fdrCutoff:設置FDR(False Discovery Rate)的閾值。默認值為 0.05。你可以增大該值來篩選更嚴格的基因集。 minGeneSetSize:設置最小基因集大小。默認值為 15。你可以增加該值來篩選更大的基因集。 maxGeneSetSize:設置最大基因集大小。默認值為 Inf(無窮大)。你可以減小該值來篩選更小的基因集。 這些參數(shù)可以根據(jù)你的需求進行調整,以擴大或縮小篩選條件。例如,如果你想要篩選更大的基因集或更顯著的結果,可以增加minGSSize、pvalueCutoff或fdrCutoff的值。如果你想要篩選更小的基因集或更嚴格的結果,可以減小maxGSSize、pvalueCutoff或fdrCutoff的值。 ? 如果遇到不懂的也可以借助線上的云平臺哦~http://www.biocloudservice.com/home.html 好了今天的GSEA就講到這里,歡迎大家有問題與小果一起討論哦~

十分鐘GSEA從原理到繪圖的評論 (共 條)

分享到微博請遵守國家法律
万源市| 西平县| 乐亭县| 舞阳县| 班玛县| 乌审旗| 定远县| 遂宁市| 区。| 阳山县| 同德县| 东丰县| 治多县| 阳江市| 外汇| 姚安县| 资兴市| 内江市| 德清县| 临桂县| 玉树县| 邹平县| 历史| 古丈县| 扎赉特旗| 汕尾市| 百色市| 通渭县| 云林县| 年辖:市辖区| 尚义县| 苏尼特右旗| 南江县| 余干县| 台州市| 丹棱县| 彭阳县| 楚雄市| 柳河县| 蛟河市| 顺平县|