無代碼實現(xiàn)WGCNA分析(二)

WGCNA分析作為近年來比較熱門的一種分析方法,已經(jīng)在許多實驗中得到了應(yīng)用,相關(guān)的文章也發(fā)表在nature communications、plant physiology、the plant journal等國際知名的植物學(xué)期刊。但是對于許多無生信基礎(chǔ)的人而言,如何理解并實施WGCNA分析卻成了一個讓人頭疼的問題。因此,為了解決這一難題,本公眾號在上一篇推文無代碼實現(xiàn)WGCNA分析(一)中詳細(xì)介紹了如何用WGCNA實現(xiàn)樣品聚類圖的繪制、最合適的power值的確定、自動網(wǎng)絡(luò)結(jié)構(gòu)和模塊的構(gòu)建、基因與模塊間的相關(guān)性的建立以及Cytoscape網(wǎng)絡(luò)的導(dǎo)出(Cytoscape圖的繪制參考之前的推文Cytoscape操作指南)。雖然,對于一些實驗而言,這些分析可能已經(jīng)足夠。但是,對于希望能夠篩選到一些重要的關(guān)鍵基因(hubgene),將文章的檔次再提高那么一點點,或者為接下來的實驗作一個更好的鋪墊,目前的WGCNA分析深度遠(yuǎn)遠(yuǎn)不夠。因此,為了完成這一目標(biāo),我們將在接下來的篇幅中重點介紹如何通過WGCNA挖掘關(guān)鍵的hubgene。
前面的步驟(第一步到第八步)可以參考無代碼實現(xiàn)WGCNA分析(一)實現(xiàn),接下來,我們代碼將沿著無代碼實現(xiàn)WGCNA分析(一)的步驟繼續(xù)分析下去。
第九步:探討基因、模塊、性狀三者間的關(guān)系,并導(dǎo)出重要的hubgene
9.1?計算各個基因與各個模塊間的內(nèi)在聯(lián)系。
其中,power_value的值選自于之前計算的值?;趐ower_value的基礎(chǔ)上分別計算所有基因與每個模塊的關(guān)聯(lián)性也就是KME值,即每個基因相對于每個模塊特征值的有符號特征值連通性。
9.2?利用性狀數(shù)據(jù),計算每個樣本與性狀的關(guān)系。
9.3?繪制基因與合并模塊之間顯著性的柱狀圖(圖1),再生成由相關(guān)性、p值和回歸線注釋的散點圖(圖2)。
注意:這里圖二包含每個模塊生成的一張圖,但是本推文僅展示一個模塊生成的圖。
經(jīng)由此步,腳本會生成圖1和圖2。


9.4?篩選hubgene
篩選hubgene的方法并不固定,每個分析者都可以根據(jù)自己的要求,設(shè)定相應(yīng)的閾值去篩選。這里,我們僅介紹兩種篩選hubgene的方法。
(1)直接根據(jù)基因與指定性狀的直接相關(guān)性、所屬模塊身份和加權(quán)相關(guān)性去篩選基因。
(2) 先基于KME和KME_pvalue去找到所有的hub基因,后基于在無代碼實現(xiàn)WGCNA分析(一)第8.3部分計算得到的性狀與模塊相關(guān)性數(shù)值,找到關(guān)鍵的hub基因。
首先,利用cor函數(shù)和corPvalueStudent函數(shù)計算KME的pvalue,并輸出相應(yīng)的文件(文件非必須輸出)。
其次,分不同的模塊抽取出其KME和KIM的值,再將其合并起來。
最后,先基于上一步計算得到的KME和KME_pvalue與篩選所有的hub基因,后基于性狀與模塊的相關(guān)性,找到關(guān)鍵的hub基因。
最后,完成所有的WGCNA分析,挖掘出關(guān)鍵的hubgene。
三 慣例小結(jié)
本公眾號開發(fā)的相關(guān)軟件,Multi-omics Hammer軟件和Multi-omics Visual軟件歡迎大家使用。文末是本公眾號在其他平臺的賬戶,也歡迎大家關(guān)注并多提意見。
簡書:WJ的生信小院
博客園:生信小院
公眾號:生信小院
最后,也歡迎各位大佬能夠在本平臺上:1傳播和講解自己發(fā)表的論文;2:發(fā)表對某一科研領(lǐng)域的看法;3:想要達(dá)成的合作或者相應(yīng)的招聘信息;4:展示自己以尋找博后工作或者博士就讀的機(jī)會;5:博導(dǎo)提供博后工作或者博士攻讀機(jī)會,都可以后臺給筆者留言。希望本平臺在進(jìn)行生信知識分享的同時,能夠成為生信分析者的交流平臺,能夠?qū)崿F(xiàn)相應(yīng)的利益互補(bǔ)和雙贏(不一定能實現(xiàn),但是夢想總得是有的吧)。


