Cytoscape可視化分析流程總結1230
Cytoscape可視化
1、cytoscape簡介
2、cytoscape使用舉例
3、圖形美化
4、子網(wǎng)提取
5、String-蛋白質(zhì)相互作用數(shù)據(jù)庫
一、Cytoscape——簡介
Cytoscape 是一個專注于開源網(wǎng)絡可視化和分析的軟件。它的核心是提供基礎的功能布局和查詢網(wǎng)絡,并依據(jù)基本的數(shù)據(jù)的結合成可視化網(wǎng)絡。Cytoscape 源自系統(tǒng)生物學,用于將生物分子交互網(wǎng)絡與高通量基因表達數(shù)據(jù)和其他的分子狀態(tài)信息整合在一起,其最強大的功能還是用于大規(guī)模蛋白質(zhì)-蛋白質(zhì)相互作用、蛋白質(zhì)-DNA和遺傳交互作用的分析。
通過Cytoscape,可以在可視化的環(huán)境下將這些生物網(wǎng)絡跟基因表達、基因型等各種分子狀態(tài)信息整合在一起,還能將這些網(wǎng)絡跟功能注釋數(shù)據(jù)庫鏈接在一起。Cytoscape 的核心是網(wǎng)絡,簡單的網(wǎng)絡圖包括節(jié)點(node)和邊(edge),每個節(jié)點可以是基因、miNRA或蛋白質(zhì)等等;節(jié)點與節(jié)點之間的連接 (edge) 代表著這些節(jié)點之間的相互作用,包括蛋白與蛋白相互作用(pp),DNA與蛋白相互作用(pd)等。
注:Cytoscape安裝前需安裝Java
主頁面注:版本為cytoscape_3.5.1

主窗口有以下幾個成分組成:
菜單欄工具欄網(wǎng)絡處理面板網(wǎng)絡主視圖窗口屬性瀏覽板塊(展示選擇的點或邊的屬性和能夠修改屬性值)
1.菜單欄:File菜單:open(打開一個Cytoscape文件);New(建立一個新的網(wǎng)絡,空的或已經(jīng)存在的網(wǎng)絡);Import(導入網(wǎng)絡數(shù)據(jù)和屬性);Export(輸出數(shù)據(jù)和圖)等Eidt菜單:Undo(撤銷);Redo(重做);create/destory view (創(chuàng)建/撤銷視圖)等View菜單:Hide/Show Control Panel(打開或隱藏網(wǎng)絡處理板塊);Show Results Panel(網(wǎng)絡瀏覽)等Select菜單:不同點和邊選擇選項;過濾器等Layout菜單:安排可視化網(wǎng)絡,Plugins菜單:管理插件(install/update/delete)和添加已經(jīng)安裝的插件注:把需要的插件從網(wǎng)絡上下載,并復制到系統(tǒng)盤的Cytoscape程序下的Plugins下就可以使用了。?2.工具欄:主要為菜單欄file的快捷鍵:打開、保存、導入(本地、數(shù)據(jù)庫、表格)/導出(網(wǎng)絡、表格、圖片)以及網(wǎng)絡主視圖窗口中網(wǎng)絡大小調(diào)整等
3.網(wǎng)絡處理板塊:network:包括所有創(chuàng)建的網(wǎng)絡,可以選擇相應的網(wǎng)絡進行操作 style:屬性(node/edge/network) Node:對點進行設置,包括:點的形狀、顏色、大?。稽c邊界線的類型、顏色、寬度;點標簽的顏色、大?。稽c背景色的透明度等 Edge:對邊進行設置,包括:邊的類型、顏色、寬度;目標處箭頭類型等。 Network:對網(wǎng)絡整體屬性進行設置,包括:背景標題等 Select:面板用于篩選符合特定標準的邊4.屬性瀏覽版塊:查看node/edge/network屬性
cytoscape-實例
本文將具體操作怎樣用Cytoscape繪制網(wǎng)絡圖
Cytoscape所支持的數(shù)據(jù)格式:1.*.sif格式:nodeA<interaction>nodeB nodeC<interaction>nodeD …即文件分為三列,第一列和第三列是有相互作用關系的基因名或蛋白質(zhì)名等,第二列是相互作用的名稱*.sif格式簡單,容易處理,但它不能規(guī)定每個節(jié)點的位置、大小、形狀等。2. xgmml格式,它是一種xml格式,可以規(guī)定節(jié)點和邊的許多信息,但也更復雜。3.*.txt格式:用tab分割的純文本文件可以將文件設置成兩列,每一列都是基因名(或蛋白質(zhì)名),同一行的兩個基因(或者蛋白質(zhì)等)代表有互作關系;也可以加其他參數(shù)放在第三列,例如兩基因調(diào)控的強弱系數(shù)
二、應用實例
本文以txt格式的數(shù)據(jù)進行演示繪制網(wǎng)絡圖網(wǎng)絡文件:net.txt:共表達網(wǎng)絡;共四列,前兩列是gene id,第三列是共表達類別(正1/負-1),第四列是相關系數(shù),以tab鍵分隔節(jié)點屬性文件: 步驟:導入網(wǎng)絡文件:file->import->network->file(net.txt)

其中不同標識代表著不同的含義

導入后

導入節(jié)點屬性文件:file->import->table->file(node.txt)(此處為table而非network)注:node.txt:節(jié)點屬性文件。四列,包含三種屬性;第一列為gene id,與網(wǎng)絡文件中一致,第二列為gene name(symbol),第三列為分子類型(蛋白編碼基因/lncRNA),第四列為節(jié)點在網(wǎng)絡中的度。

上方紅色方框中“Target Table Data”的信息表示將導入的節(jié)點屬性表與之前的網(wǎng)絡圖相關聯(lián),其中“Network Collection”選擇的是我們之前導入的網(wǎng)絡文件,其他參數(shù)默認如下,可不用修改,如為其他選項,則需要通絡下拉列表重新選擇。下方紅色方框中“Preview”中:gene,name,molecular type,degree第一列gene,設置為“Key”,保證gene id不重復,第二三四列均為屬性“Attribute”,如需修改,同樣點擊名稱右側(cè)的三角形標志。點擊確定后,乍看感覺圖形沒有變化,但此時下方的Table Panel中已自動多出了molecular type,degree兩列

可以通過style中進行簡單網(wǎng)絡圖格式設置

得到網(wǎng)絡圖:

也可以自行拖拽進行微調(diào)導出文件:數(shù)據(jù)的導出可以是網(wǎng)絡文件,表格文件或者是圖片文件,圖片文件包括多種圖片格式以及pdf格式,在工具欄中對應選擇即可點擊菜單欄的圖片導出*.pdf(同樣可以采用export導出其它格式)

注:注意調(diào)整網(wǎng)絡圖后再保存,否則會出現(xiàn)網(wǎng)絡圖不完整
三、網(wǎng)絡美化
應用上篇所得到的網(wǎng)絡圖進行美化
1.統(tǒng)一模板美化:
采用模板進行簡單美化

得到網(wǎng)絡圖

2.根據(jù)數(shù)據(jù)含義進行美化
根據(jù)的molecluar type標注節(jié)點所代表lncRNA或者protein點擊網(wǎng)絡處理面板中style->node->shape進行設置點的形狀,并勾選“Lock node width and height”。

點擊網(wǎng)絡處理面板中style->node->fill color進行設置點的顏色Column選擇“molecluar type”和MApping Type選擇“Discrete MApping”,并將lncRNA與protein設置成兩種顏色區(qū)分

根據(jù)節(jié)點的大小來顯示dregee大小,dregee值越大節(jié)點直徑越大。

同樣可以對點進行類似的細化設置(根據(jù)下列參數(shù)進行設置)

根據(jù)correlation的值調(diào)整邊的顏色:點擊網(wǎng)絡處理面板中style->edge->stroke color進行設置Column設置為correlation,mApping type設置為continues mApping,current mApping(默認為白-黑)

注:可以雙擊灰色圖標進行設置其它顏色,點擊set min and max 設置數(shù)值,雙擊圖形右上角的倒三角選擇最大值顯示的顏色;同樣雙擊左上角倒三角選擇最小值的顏色;如果需要增加圖注,可點擊“Add”按鈕


同樣也可以對邊進行細化設置最后再調(diào)整“Layout”得到滿意的圖

得到網(wǎng)絡圖:
最后點擊菜單欄的圖片導出*.pdf(同樣可以采用export導出其它格式)注:注意調(diào)整網(wǎng)絡圖后再保存,否則會出現(xiàn)網(wǎng)絡圖不完整
四、子網(wǎng)提取
導入文件:file->import->network->file(ppi.txt)(HPRD中處理后的文件)
注:注意第一行是否為標題行,若是記得在advanced中去掉√節(jié)點選擇:Select->node注:節(jié)點的選擇可以通過將目標節(jié)點放在一個文件中導入,如果節(jié)點數(shù)少的話可以手動點選
注:黃色點為所選的目標節(jié)點
若想把其與大網(wǎng)絡分離的話就點擊菜單的圖標欄里倒數(shù)第四個圖標,獲得子圖
同樣可對子網(wǎng)進行修飾如:改變節(jié)點顏色性質(zhì)并將蛋白質(zhì)換成對應的gene symbol(label中設置)
最后導出圖片用MCODE插件,篩選出子網(wǎng)注:Mcode下載地址:http://Apps.cytoscape.org/Apps/mcode導入文件:file->import->network->file(net.txt)用MCODE插件篩選子網(wǎng),參數(shù)可根據(jù)數(shù)據(jù)自行設置
分析后得到5個子網(wǎng)
可以將它創(chuàng)建到主窗口進行style調(diào)整或者導出創(chuàng)建到主窗口后
對創(chuàng)建到主圖的子圖進行修飾
保存子網(wǎng)即可MCODE詳細介紹可參考http://baderlab.org/Software/MCODE/UsersManual
四、String-蛋白質(zhì)相互作用數(shù)據(jù)庫
STRING是蛋白質(zhì)相互作用數(shù)據(jù)庫,可進行是搜索已知蛋白之間和預測蛋白質(zhì)之間相互作用主頁:
按照蛋白質(zhì)名稱,氨基酸序列等信息進行檢索某個特定的蛋白質(zhì)相互作用的其他蛋白質(zhì)例如:TP53 人類,選擇人類
繼續(xù)點continue,得到檢索結果
圓圈代表蛋白質(zhì),點擊圓圈可以查看蛋白質(zhì)相關信息

直線代表蛋白質(zhì)之間相互作用,點擊可以查看互作信息

Setting中可以設置網(wǎng)絡邊代表的意義evidence:不同顏色的線表示不同證據(jù) confidence:兩個蛋白質(zhì)相互作用越強連線越粗 actions:不同顏色和形狀的線表示不同的作用

例如confidence

cluster聚類

得到結果

還可以對網(wǎng)絡進行分析、視圖放大縮小或保存輸入某些蛋白質(zhì)名稱或氨基酸序列,檢索其相互作用關系

例如:輸入TP53、BCL2、MDM2、CDK2,并選擇人類檢索結果

String與Cytoscape聯(lián)用
將String的蛋白互作數(shù)據(jù)下載到Cytoscape本地中Cytoscape中Apps->stringApp

安裝完畢后,回到文件>import>network>public databases選擇string數(shù)據(jù)庫,以基因或蛋白輸入

以TP53為例,選擇score為0.2,連接的基因最大為80個。

也可以在已構建好的網(wǎng)絡中可以擴展新的連接蛋白數(shù)或者重設confidence score來調(diào)整網(wǎng)絡大小。

例如重新調(diào)整confidence score


可以進一步保存修改調(diào)整網(wǎng)絡