生信高級圖大賞之山脊圖
“看山不是山”,本期一起來欣賞一張“山脊圖”。
一、簡介
熟悉組學分析的小伙伴們都知道,基因集富集分析(GSEA)是繞不開的話題,它是另一種用于基因集合功能探究的方法。GSEA的可視化圖類型相對較少,下圖即是其中一種展示方式:

這張圖看起來十分高級,層層堆疊的曲線,如同一座座連綿的小山,我們可以將其稱為“山脊圖”。本質(zhì)上,它是一種密度圖,以一條中心線為基準,兩側(cè)呈現(xiàn)出數(shù)據(jù)的分布情況。這張圖為我們展示了基因集之間的富集情況以及富集通路的核心富集基因的表達分布情況。在基因集富集分析中,通常核心富集基因會在某個表達水平上集中分布,在這種情況下就會形成類似于正態(tài)分布的曲線,從而展現(xiàn)出“山脊”的模樣。通過觀察山脊圖,我們可以直觀地了解核心基因在不同通路中的表達水平,從而揭示富集通路的活躍程度和差異。
那這種強大的工具又是出自何手?
熟悉往期推文的朋友可能猜到了,enrichplot——一個非常強大的R包,通過其內(nèi)置的ridgeplot函數(shù),只需幾行代碼,就可以生成一個美觀而富有信息量的“山脊圖”。同時,它還提供了豐富的參數(shù)選項,可以根據(jù)個人需求進行定制,例如調(diào)整線條顏色、線寬、填充類型和顏色等。
二、圖解
橫軸:
表示富集通路的核心富集基因表達倍數(shù)log2轉(zhuǎn)換值的分布范圍;
縱軸:
表示各通路中富集基因分布的頻率;
圖例:
各富集通路的p值,并通過漸變顏色表示值的變化,顏色越紅表示越顯著。
三、應用
這種“山脊圖”在富集通路分析中具有重要的應用價值。通過展示核心基因的表達分布,我們可以更好地理解富集通路的功能和調(diào)控機制,這對于生物學研究和藥物開發(fā)具有重要意義。例如,在癌癥研究中,我們可以用來展示與腫瘤相關(guān)的富集通路的核心基因的表達分布,從而揭示腫瘤的發(fā)生機制和潛在治療靶點。
輕舟已過萬重山,小伙伴們快去“乘舟破浪”吧。
關(guān)于enrichplot的詳細使用方法請戳:
http://www.bioconductor.org/packages/release/bioc/html/enrichplot.html
