無(wú)代碼實(shí)現(xiàn)WGCNA分析(一)

WGCNA分析,全稱為加權(quán)共表達(dá)網(wǎng)絡(luò)分析,英文名為Weighted Correlation Network Analysis,功能包括包括基本數(shù)據(jù)清理、相關(guān)網(wǎng)絡(luò)構(gòu)建、模塊識(shí)別、匯總以及變量和模塊與樣本性狀的關(guān)聯(lián)等功能。
對(duì)于一些生信分析小白而言,或許聽(tīng)說(shuō)這個(gè)分析,但是卻無(wú)從下手。超多代碼的撰寫(xiě)也一些剛?cè)腴T(mén)的生信者感到頭疼。因此,本文希望通過(guò)對(duì)代碼的一步步解析,闡述如何實(shí)現(xiàn)無(wú)代碼進(jìn)行WGCNA分析,從而幫助相關(guān)讀者的文章上升一個(gè)小檔次。
為方便介紹,本文將從數(shù)據(jù)準(zhǔn)備、代碼解析,結(jié)果解讀三個(gè)方面對(duì)這些內(nèi)容進(jìn)行解析。其中數(shù)據(jù)準(zhǔn)備和結(jié)果解讀將在代碼解析中一一講解。
第一步:加載相應(yīng)的R包
這里面值得注意是WGCNA包,此包需要安裝許多依賴包才能實(shí)現(xiàn)。
第二步:讀取相應(yīng)的文件
2.1 輸入文件包括三個(gè),分別為:權(quán)重文件inputfile_weightfile;表型文件inputfile_phenotype;參數(shù)文件plot_args_file。
權(quán)重文件inputfile_weightfile的首行為樣本名稱,首列則為基因名稱,具體格式可以參考文本1。
文本1
表型文件inputfile_phenotype的首行是你所設(shè)定的表型,首列則是你有的樣品,其間的內(nèi)容則是你表型關(guān)系。
文本2
參數(shù)文件plot_args_file則包含兩列,首列是參數(shù)名,第二列是參數(shù)的數(shù)值,具體格式可以參考文本3。
文本3
2.2?輸出文件則以一個(gè)前綴(outputfilename)統(tǒng)計(jì)命名,從outputfile_plot1到outputfile_trait_hubGenes_file則為輸出的一系列文件。
2.3?從參數(shù)文件中讀取并設(shè)置相應(yīng)的參數(shù)。
本腳本會(huì)生成非常多的圖片與輸出文件,因此也設(shè)置了很多的參數(shù)。接下來(lái),將一一解析這些參數(shù)。
2.4?這部分參數(shù)為官方建議,如非必要,則建議不要更改。
2.5?這兩行腳本的含義是確認(rèn)是否支持本腳本使用多線程運(yùn)行。
2.6?對(duì)數(shù)據(jù)進(jìn)行處理,方便后面進(jìn)行計(jì)算。
注意:分別指定樣品數(shù)量和基因數(shù)量的兩個(gè)參數(shù)nSamples與nGenes不能出錯(cuò)。
注意:在此步中,你可以選擇設(shè)定篩選條件去除那些干擾分析結(jié)果的基因,避免這些基因的表達(dá)數(shù)據(jù)造成分析結(jié)果出現(xiàn)偏差。
注意:最后的步驟將權(quán)重?cái)?shù)據(jù)進(jìn)行轉(zhuǎn)置,再進(jìn)行下面的分析。
第三步:繪制聚類圖
對(duì)數(shù)據(jù)進(jìn)行聚類分析,并繪制聚類圖(對(duì)樣品聚類)。
經(jīng)由此步,會(huì)生成下列的圖形。

第四步:確定最合適的power值,并繪制powers圖
4.1?獲取不同的powers值。
調(diào)用pickSoftThreshold函數(shù)確定合適的power,從而進(jìn)行軟閾值的無(wú)尺度拓?fù)浞治觥?/p>
4.2?如果未找到合適的power值,則根據(jù)樣本數(shù)量來(lái)確定power值(這一步也是在數(shù)據(jù)特別不好的前提下做出的選擇)。
4.3?對(duì)Soft即powers計(jì)算結(jié)果進(jìn)行可視化。
經(jīng)由此步,會(huì)生成下列的圖形。

第五步:以塊方式檢測(cè)大型表達(dá)式數(shù)據(jù)集,并構(gòu)建自動(dòng)網(wǎng)絡(luò)結(jié)構(gòu)和模塊
調(diào)用blockwiseModules函數(shù)進(jìn)行分析,構(gòu)建網(wǎng)絡(luò)
注意,此步驟只會(huì)產(chǎn)生一個(gè)文件(當(dāng)maxBlockSize指定為基因數(shù)時(shí))
如果maxBlockSize小于基因數(shù),則會(huì)生成數(shù)個(gè)".tom"文件,這將導(dǎo)致load(Block_network$TOMFiles[1],verbose=T)函數(shù)無(wú)法讀全所有的TOM文件。
但是對(duì)于內(nèi)存較少卻需要分析大數(shù)據(jù)的分析者而言,建議保存數(shù)據(jù)的時(shí)候?qū)?#34;.tom"文件進(jìn)行切割,后采取逐一加載的方式讀入數(shù)據(jù)。
第六步:構(gòu)建網(wǎng)絡(luò),并可視化基因與模塊、模塊與模塊,基因與基因間的相關(guān)性
6.1?調(diào)用plotDendroAndColors函數(shù)繪制基因與模塊的層次聚類圖,從而展示基因與模塊的對(duì)應(yīng)關(guān)系。
其中unmergedColors用于繪制未合并的模塊與基因的關(guān)系,而colors則用于繪制已經(jīng)合并后的模塊與基因的關(guān)系。
經(jīng)由此步,會(huì)生成下列的圖形

6.2?調(diào)用plotEigengeneNetworks函數(shù)繪制各模塊之間相關(guān)性圖。
對(duì)于已經(jīng)合并后的模塊間的關(guān)系通過(guò)用plotEigengeneNetworks函數(shù)進(jìn)行分析和圖形可視化。
經(jīng)由此步,會(huì)生成下列的圖形

6.3?調(diào)用TOMplot函數(shù)繪制TOM圖
加載構(gòu)建網(wǎng)絡(luò)的TOMFiles文件(注意如果".tom"是多個(gè),則可能需要多次加載相應(yīng)數(shù)據(jù),具體內(nèi)容詳見(jiàn)官網(wǎng)),并利用這個(gè)文件進(jìn)行繪圖
繪制各基因間的相關(guān)性,這一步也最為耗時(shí)。
注意,此步驟調(diào)用module_Colors_list表明分析采用合并后的模塊結(jié)果
經(jīng)由此步,會(huì)生成下列的圖形

第七步:利用第五步獲得TOM值,從而導(dǎo)出基因之間的關(guān)系,用于Cytoscape圖的繪制
調(diào)用exportNetworkToCytoscape函數(shù)進(jìn)行分析,導(dǎo)出Cytoscape繪制網(wǎng)絡(luò)所需要的數(shù)據(jù)
第八步:調(diào)用表型數(shù)據(jù)(如果有的話),獲取關(guān)注的列與基因,并繪制表型與模塊之間的相關(guān)性的熱圖
8.1?檢測(cè)是否有表型數(shù)據(jù)
此步驟調(diào)用match是確保權(quán)重文件的樣品名與表型數(shù)據(jù)的樣品名能夠一一對(duì)應(yīng)
8.2?關(guān)聯(lián)表型數(shù)據(jù)與模塊數(shù)據(jù),并將關(guān)鍵表型數(shù)據(jù)與各個(gè)模塊放到一起作為獨(dú)立單元(也可以認(rèn)為是獨(dú)立模塊)進(jìn)行分析
8.3?繪制模塊與各性狀的關(guān)系圖
8.4?關(guān)聯(lián)重點(diǎn)表型數(shù)據(jù)(參數(shù)中的key_module)與關(guān)鍵模塊基因(參數(shù)中的key_pheno)的相關(guān)性
上一步產(chǎn)生的圖形很多,包括以下三組圖形



三 慣例小結(jié)
到這里,基本上就完成了WGCNA所有可視化工作了,下一章將介紹一下如何篩選關(guān)鍵的hubgene。
本公眾號(hào)開(kāi)發(fā)的相關(guān)軟件,Multi-omics Hammer軟件和Multi-omics Visual軟件歡迎大家使用。文末是本公眾號(hào)在其他平臺(tái)的賬戶,也歡迎大家關(guān)注并多提意見(jiàn)。
簡(jiǎn)書(shū):WJ的生信小院
博客園:生信小院
微信公眾號(hào):生信小院
最后,也歡迎各位大佬能夠在本平臺(tái)上:1傳播和講解自己發(fā)表的論文;2:發(fā)表對(duì)某一科研領(lǐng)域的看法;3:想要達(dá)成的合作或者相應(yīng)的招聘信息;4:展示自己以尋找博后工作或者博士就讀的機(jī)會(huì);5:博導(dǎo)提供博后工作或者博士攻讀機(jī)會(huì),都可以后臺(tái)給筆者留言。希望本平臺(tái)在進(jìn)行生信知識(shí)分享的同時(shí),能夠成為生信分析者的交流平臺(tái),能夠?qū)崿F(xiàn)相應(yīng)的利益互補(bǔ)和雙贏(不一定能實(shí)現(xiàn),但是夢(mèng)想總得是有的吧)。


