左右雙側(cè)條形圖展示基因本體論BP、CC、MF三合一富集分析結(jié)果C、MF三合一富集分析結(jié)果
基因本體論(Gene Ontology,GO)計劃(http://www.geneontology.org)為注釋基因、基因產(chǎn)物和序列開發(fā)了一套結(jié)構(gòu)化的、受控詞匯表。它被分成三部分:分子功能(Molecular Function,MF)、生物過程(Biological Process,BP)和細胞組分(Cell Component,CC)。
GO功能富集分析結(jié)果,一般都會包含至少4列:GO term,基因數(shù),P值和類別。今天給大家?guī)硪粡埛浅V庇^,顏值也頗高的GO富集結(jié)果可視化圖。
1,打開繪圖頁面
首先,使用瀏覽器(推薦chrome或者edge)打開GO BP、CC、MF三合一雙側(cè)條形圖繪制頁面,左側(cè)為常見作圖導航,中間為數(shù)據(jù)輸入框和可選參數(shù),右側(cè)為描述和結(jié)果示例。
http://www.bioinformatics.com.cn/plot_basic_GO_term_bp_cc_mf_left_right_bar_plot_191
圖1.可視化頁面
2,示例數(shù)據(jù)
點擊右側(cè)“示例數(shù)據(jù)”鏈接下載excel格式的示例數(shù)據(jù)。
示例數(shù)據(jù)(僅供參考)包括4列:
第1列是GO term名字;
第2列是分類(分類名必需是Biological process、Cellular component、Molecular function,且按照順序排列);
第3列是Pvalue(或者FDR、qvalue等,程序會默認自動將其轉(zhuǎn)化成-log10值,因此p值不能為0),每個類別之內(nèi)的條目可以按照P值從小到大,或者從大到小排列;
第4列是基因數(shù);
注意:你需要參考示例數(shù)據(jù),將自己的富集結(jié)果在excel中整理成示例數(shù)據(jù)的樣式。
圖2. 輸入數(shù)據(jù)示例
3,粘貼示例數(shù)據(jù)
直接復制示例數(shù)據(jù)中的ABCD 4列數(shù)據(jù),然后粘貼到輸入框。
注意:不是拷貝excel文件,是拷貝excel文件里邊的數(shù)據(jù)哦。另外粘貼到輸入框后,格式亂了沒關(guān)系,只要在excel中是整齊的就行。并且數(shù)據(jù)矩陣中不能有空的單元格,中文字符等。
圖3. 必需輸入
4,修改參數(shù),并提交
我們設(shè)置了圖片尺寸,顏色等參數(shù),基本能滿足日常繪圖使用。如需更高級的定制,請聯(lián)系我們。
部分參數(shù)詳解:
顏色:這里我們還是使用Nature Publishing Group的配色。
左側(cè)最大值:用來控制左側(cè)的柱子距離左邊界的距離,請使用可整除的整數(shù)
右側(cè)最大值:用來控制右側(cè)的柱子距離右邊界的距離,請使用可整除的整數(shù)
這兩個值需要與圖片長寬配合著使用,以保證零點位置不是0.0。
圖4. 顏色等可調(diào)參數(shù)
5,提交出圖
輸入數(shù)據(jù)粘貼好,參數(shù)調(diào)整好后,點擊提交按鈕,約3秒后,在頁面右側(cè)會出現(xiàn)結(jié)果預覽圖。我們提供了4種圖片格式供下載使用,兩種矢量圖(pdf,svg)和兩種標量圖(600 dpi tiff和300 dpi png)。
圖左側(cè)表示GO term的統(tǒng)計p值(-log10轉(zhuǎn)化),p值越小,條形越長;并且按照顏色區(qū)分三部分;
圖右側(cè)表示富集的基因數(shù),基因數(shù)越多,條形越長。
點評:與氣泡圖相比,該圖的優(yōu)點在于一眼就能分辨出那個term的基因數(shù)最多,P值最小。因為人們對于顏色的分辨程度要低于對尺寸的分辨程度,特別是在顏色差別不大的情況下。
圖5.預覽與下載
沒有預覽就是沒有出圖,這時請參考示例數(shù)據(jù),檢查輸入數(shù)據(jù)格式。
遇到文字截斷,需要修改字體、調(diào)整字體大小等,使用scape軟件。