生信分析中的GSEA圖譜看不懂?看這里
爾云間 一個專門做科研的團隊
? ? ?

小伙伴們,大家好呀,很高興和大家見面,最近看到有果粉提問關于GSEA圖譜的問題,之前呢有寫過關于其它圖譜的分析,如果有小伙伴需要,可直接在往期里面查找就可以了,今天呢我們來聊聊關于如何進行GSEA讀圖。
內(nèi)容分為兩部分:
一是GSEA分析是什么?
二是GSEA圖譜解讀。
走神的,還沒有準備好的小伙伴快來看這吧。

一、GSEA分析是什么?
GSEA:是基因集富集分析,全稱為Gene Set Enrichment Analysis,它是用來評估基因集中基因在與表型相關度排序的基因表中的分布趨勢,從而判斷其對表型的貢獻。通俗的來講就是判斷此基因集內(nèi)基因的協(xié)同變化對表型變化產(chǎn)生的影響。
二、GSEA圖譜解讀
在分析進行圖譜解讀前我們首先看看GSEA圖譜長什么樣,大概就是像下圖這樣的。左圖是富集一條通路上的情況,右圖是富集到多條通路上情況。

實際情況中小伙伴遇到的富集通路可能比較多,小果在這里為了方便解讀選擇富集到一條通路上的圖譜進行解讀。
當小伙伴拿到這樣一張圖時,看到這是一張復合圖,由Enrichment score折線圖、基因排列和rank值得分布圖組成。在拿圖時小伙伴們別被它嚇到,首先去了解下橫縱坐標表示的什么。左圖中橫坐標的名稱是Rank in Ordered DataSet,代表的是數(shù)據(jù)集的排序值。縱坐標有兩個,一個是Enrichment?score,代表的是富集分數(shù),另一個是Ranked list metric,代表的是基因排序量。
這樣的話我們就先來看第一部分的Enrichment score折線圖:它展示的就是基因集中基因按排序計算時,富集分數(shù)在計算到每個位置時的展示。可以在圖中看到曲線有個最高峰,該處的得分就是是基因集的富集評分,位于最高峰前的的基因就是核心基因。
第二部分:基因集中基因排列的情況圖,即圖中紅色的的豎線排列情況情況,還可以看到紅色豎線中有SPLICEOSOME(ES=0.5179,NP=0.0040),這是富集到的通路名稱SPLICEOSOME,ES代表的就是富集評分,NP就是顯著性。
第三部分是排序后所有基因rank值得分布圖,圖中有L與H兩部分,L組中相對對應的基因在中高表達,H組中對應的基因低表達,每個基因?qū)男旁氡龋⊿ignal2noise,前面選擇的排序值計算方式)以灰色面積圖顯展示。
當然小伙伴在實際的分析中可能會遇到多個通路,分析的方法也是一模一樣,小伙伴可以使用自己的數(shù)據(jù)試著分析下,今天的分享就到此結束了,有問題可以給小果留言哦。

推薦閱讀
關注小果,小果將會持續(xù)為你帶來更多生信干貨哦。

生信果? 生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復現(xiàn)、生信硬核知識技能、服務器等原創(chuàng)內(nèi)容