手把手教你給KEGG pathway標(biāo)注顏色
今天是六一兒童節(jié),祝寶寶們節(jié)日快樂(lè)。
KEGG是一個(gè)整合了基因、化合物、酶和系統(tǒng)功能的數(shù)據(jù)庫(kù),它利用圖形來(lái)表征代謝通路,以及各種通路間的關(guān)系,使得研究者能夠在系統(tǒng)層面了解所關(guān)注的代謝通路(pathway)。
KEGG通路圖因其形式美觀、容易理解等優(yōu)點(diǎn),在論文中經(jīng)常出現(xiàn),特別是標(biāo)注感興趣的基因/化合物后,結(jié)果更加清晰。
以小鼠MAPK signaling pathway為例,該通路的id為mmu04010。要將感興趣的基因或者化合物標(biāo)注顏色,我們可以直接在KEGG網(wǎng)站進(jìn)行操作。
1,打開(kāi)通路對(duì)應(yīng)的pathway圖鏈接
https://www.genome.jp/pathway/mmu04010
其中左側(cè)是功能區(qū),用來(lái)搜索,上色等。
右側(cè)為pathway圖,網(wǎng)頁(yè)版時(shí)該圖為交互式的,即鼠標(biāo)放在某元素上,會(huì)彈出相應(yīng)的信息。
2,尋找感興趣的基因或者化合物
一般我們獲得的都是gene symbol。例如,我們對(duì)Mknk2、Gadd45b、Map2k2、Igf1、Ptprr這5個(gè)基因比較感興趣(例如差異表達(dá))。我們可以搜索這5個(gè)基因?qū)?yīng)的geneid(或者化合物id)。這里我們?cè)谧笊辖?/span>Search下面的輸入框中輸入Mknk2,點(diǎn)擊GO按鈕。
然后會(huì)在輸入框下面顯示所查詢(xún)基因?qū)?yīng)的geneid 17347(黃色背景所示),同時(shí)會(huì)在繪圖區(qū)展示出該基因所在的位置,鼠標(biāo)懸停在查詢(xún)結(jié)果的17347上時(shí),右側(cè)圖對(duì)應(yīng)位置會(huì)高亮。這里每次只能查詢(xún)1個(gè),所以我們需要查詢(xún)5次,以確定我們待標(biāo)注基因的geneid,以備后續(xù)給圖標(biāo)注顏色使用。
17347 Mknk2
17873 Gadd45b
26396 Map2k2
16000 Igf1
19279 Ptprr
注意:這里搜索策略是文本匹配,因此可能會(huì)出現(xiàn)1對(duì)多的結(jié)果,這時(shí)需要仔細(xì)找到精確匹配結(jié)果。
當(dāng)然,若有g(shù)eneid,也可以使用ID search
3,設(shè)置顏色
獲得對(duì)應(yīng)的id后,我們可以在txt編輯器中編輯顏色,每行一個(gè),包括id和顏色兩列,空格分隔。例如:
4,標(biāo)注顏色
點(diǎn)擊Color右側(cè)的“+”,拷貝步驟3整理好的結(jié)果,粘貼到輸入框中,然后點(diǎn)擊“Exec”按鈕執(zhí)行上色。
5,下載
點(diǎn)擊“Exec”按鈕后,即可獲得上色后的圖,點(diǎn)擊圖上面的“Image file”即可下載標(biāo)注好顏色的通路圖。
注意:由于一個(gè)元素可能包含多個(gè)基因,或者1個(gè)基因出現(xiàn)在多個(gè)元素中,因此待標(biāo)注的基因數(shù)可能與最終結(jié)果的個(gè)數(shù)不一致。
我們也可以使用多種顏色,支持RGB顏色,例如 #FF0000表示red,#0000FF表示blue等。但是需要注意顏色不能與名字顏色一致,例如名字顏色是黑色,那么標(biāo)注黑色就不妥。
當(dāng)然,我們也可以使用pathviewR包來(lái)標(biāo)注顏色。其原理是:KEGG pathway圖是用KGML(KEGG Markup Language)語(yǔ)言存儲(chǔ)的。一個(gè)pathway圖對(duì)應(yīng)有一個(gè)KGML文件。圖上的元素可以在其對(duì)應(yīng)的KGML文件中找到。因此,找到KGML中對(duì)應(yīng)元素的位置信息,例如矩形元素包括x,y坐標(biāo)及高度和長(zhǎng)度,根據(jù)這4個(gè)信息即可為相應(yīng)矩形渲染顏色。
在線(xiàn)標(biāo)注vs本地標(biāo)注。在線(xiàn)標(biāo)注所使用的數(shù)據(jù)是最新的,而本地程序可能不是最新的(針對(duì)那些自行下載的KGML和pathway圖),或者會(huì)因?yàn)榫W(wǎng)絡(luò)問(wèn)題標(biāo)注失敗。
微生信云平臺(tái) 注冊(cè)用戶(hù)41000+ 引用447篇
微生信云平臺(tái)(http://www.bioinformatics.com.cn)以160多款在線(xiàn)作圖、在線(xiàn)數(shù)據(jù)分析為基本方式,致力于0代碼分析科研數(shù)據(jù),0代碼展示數(shù)據(jù)結(jié)果,幫助生命科學(xué)、醫(yī)學(xué)等領(lǐng)域的科研工作者更便捷地分析數(shù)據(jù),了解數(shù)據(jù),挖掘數(shù)據(jù)背后的生物醫(yī)學(xué)意義,輔助科研,促進(jìn)知識(shí)傳播。