最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

無(wú)代碼實(shí)現(xiàn)WGCNA分析(一)

2022-11-01 20:14 作者:生信小院  | 我要投稿


WGCNA分析,全稱為加權(quán)共表達(dá)網(wǎng)絡(luò)分析,英文名為Weighted Correlation Network Analysis,功能包括包括基本數(shù)據(jù)清理、相關(guān)網(wǎng)絡(luò)構(gòu)建、模塊識(shí)別、匯總以及變量和模塊與樣本性狀的關(guān)聯(lián)等功能。


對(duì)于一些生信分析小白而言,或許聽(tīng)說(shuō)這個(gè)分析,但是卻無(wú)從下手。超多代碼的撰寫(xiě)也一些剛?cè)腴T(mén)的生信者感到頭疼。因此,本文希望通過(guò)對(duì)代碼的一步步解析,闡述如何實(shí)現(xiàn)無(wú)代碼進(jìn)行WGCNA分析,從而幫助相關(guān)讀者的文章上升一個(gè)小檔次。


為方便介紹,本文將從數(shù)據(jù)準(zhǔn)備、代碼解析,結(jié)果解讀三個(gè)方面對(duì)這些內(nèi)容進(jìn)行解析。其中數(shù)據(jù)準(zhǔn)備和結(jié)果解讀將在代碼解析中一一講解。


第一步:加載相應(yīng)的R包

這里面值得注意是WGCNA包,此包需要安裝許多依賴包才能實(shí)現(xiàn)。

第二步:讀取相應(yīng)的文件

2.1 輸入文件包括三個(gè),分別為:權(quán)重文件inputfile_weightfile;表型文件inputfile_phenotype;參數(shù)文件plot_args_file。

權(quán)重文件inputfile_weightfile的首行為樣本名稱,首列則為基因名稱,具體格式可以參考文本1。

文本1

表型文件inputfile_phenotype的首行是你所設(shè)定的表型,首列則是你有的樣品,其間的內(nèi)容則是你表型關(guān)系。

文本2

參數(shù)文件plot_args_file則包含兩列,首列是參數(shù)名,第二列是參數(shù)的數(shù)值,具體格式可以參考文本3。

文本3

2.2?輸出文件則以一個(gè)前綴(outputfilename)統(tǒng)計(jì)命名,從outputfile_plot1到outputfile_trait_hubGenes_file則為輸出的一系列文件。

2.3?從參數(shù)文件中讀取并設(shè)置相應(yīng)的參數(shù)。

本腳本會(huì)生成非常多的圖片與輸出文件,因此也設(shè)置了很多的參數(shù)。接下來(lái),將一一解析這些參數(shù)。

2.4?這部分參數(shù)為官方建議,如非必要,則建議不要更改。

2.5?這兩行腳本的含義是確認(rèn)是否支持本腳本使用多線程運(yùn)行。

2.6?對(duì)數(shù)據(jù)進(jìn)行處理,方便后面進(jìn)行計(jì)算。

注意:分別指定樣品數(shù)量和基因數(shù)量的兩個(gè)參數(shù)nSamples與nGenes不能出錯(cuò)。

注意:在此步中,你可以選擇設(shè)定篩選條件去除那些干擾分析結(jié)果的基因,避免這些基因的表達(dá)數(shù)據(jù)造成分析結(jié)果出現(xiàn)偏差。

注意:最后的步驟將權(quán)重?cái)?shù)據(jù)進(jìn)行轉(zhuǎn)置,再進(jìn)行下面的分析。

第三步:繪制聚類圖

對(duì)數(shù)據(jù)進(jìn)行聚類分析,并繪制聚類圖(對(duì)樣品聚類)。

經(jīng)由此步,會(huì)生成下列的圖形。


第四步:確定最合適的power值,并繪制powers圖

4.1?獲取不同的powers值。

調(diào)用pickSoftThreshold函數(shù)確定合適的power,從而進(jìn)行軟閾值的無(wú)尺度拓?fù)浞治觥?/p>

4.2?如果未找到合適的power值,則根據(jù)樣本數(shù)量來(lái)確定power值(這一步也是在數(shù)據(jù)特別不好的前提下做出的選擇)。

4.3?對(duì)Soft即powers計(jì)算結(jié)果進(jìn)行可視化。

經(jīng)由此步,會(huì)生成下列的圖形。


第五步:以塊方式檢測(cè)大型表達(dá)式數(shù)據(jù)集,并構(gòu)建自動(dòng)網(wǎng)絡(luò)結(jié)構(gòu)和模塊

調(diào)用blockwiseModules函數(shù)進(jìn)行分析,構(gòu)建網(wǎng)絡(luò)

注意,此步驟只會(huì)產(chǎn)生一個(gè)文件(當(dāng)maxBlockSize指定為基因數(shù)時(shí))

如果maxBlockSize小于基因數(shù),則會(huì)生成數(shù)個(gè)".tom"文件,這將導(dǎo)致load(Block_network$TOMFiles[1],verbose=T)函數(shù)無(wú)法讀全所有的TOM文件。

但是對(duì)于內(nèi)存較少卻需要分析大數(shù)據(jù)的分析者而言,建議保存數(shù)據(jù)的時(shí)候?qū)?#34;.tom"文件進(jìn)行切割,后采取逐一加載的方式讀入數(shù)據(jù)。

第六步:構(gòu)建網(wǎng)絡(luò),并可視化基因與模塊、模塊與模塊,基因與基因間的相關(guān)性

6.1?調(diào)用plotDendroAndColors函數(shù)繪制基因與模塊的層次聚類圖,從而展示基因與模塊的對(duì)應(yīng)關(guān)系。

其中unmergedColors用于繪制未合并的模塊與基因的關(guān)系,而colors則用于繪制已經(jīng)合并后的模塊與基因的關(guān)系。

經(jīng)由此步,會(huì)生成下列的圖形


6.2?調(diào)用plotEigengeneNetworks函數(shù)繪制各模塊之間相關(guān)性圖。

對(duì)于已經(jīng)合并后的模塊間的關(guān)系通過(guò)用plotEigengeneNetworks函數(shù)進(jìn)行分析和圖形可視化。

經(jīng)由此步,會(huì)生成下列的圖形


6.3?調(diào)用TOMplot函數(shù)繪制TOM圖

加載構(gòu)建網(wǎng)絡(luò)的TOMFiles文件(注意如果".tom"是多個(gè),則可能需要多次加載相應(yīng)數(shù)據(jù),具體內(nèi)容詳見(jiàn)官網(wǎng)),并利用這個(gè)文件進(jìn)行繪圖

繪制各基因間的相關(guān)性,這一步也最為耗時(shí)。

注意,此步驟調(diào)用module_Colors_list表明分析采用合并后的模塊結(jié)果


經(jīng)由此步,會(huì)生成下列的圖形

第七步:利用第五步獲得TOM值,從而導(dǎo)出基因之間的關(guān)系,用于Cytoscape圖的繪制

調(diào)用exportNetworkToCytoscape函數(shù)進(jìn)行分析,導(dǎo)出Cytoscape繪制網(wǎng)絡(luò)所需要的數(shù)據(jù)

第八步:調(diào)用表型數(shù)據(jù)(如果有的話),獲取關(guān)注的列與基因,并繪制表型與模塊之間的相關(guān)性的熱圖

8.1?檢測(cè)是否有表型數(shù)據(jù)

此步驟調(diào)用match是確保權(quán)重文件的樣品名與表型數(shù)據(jù)的樣品名能夠一一對(duì)應(yīng)

8.2?關(guān)聯(lián)表型數(shù)據(jù)與模塊數(shù)據(jù),并將關(guān)鍵表型數(shù)據(jù)與各個(gè)模塊放到一起作為獨(dú)立單元(也可以認(rèn)為是獨(dú)立模塊)進(jìn)行分析

8.3?繪制模塊與各性狀的關(guān)系圖

8.4?關(guān)聯(lián)重點(diǎn)表型數(shù)據(jù)(參數(shù)中的key_module)與關(guān)鍵模塊基因(參數(shù)中的key_pheno)的相關(guān)性

上一步產(chǎn)生的圖形很多,包括以下三組圖形



三 慣例小結(jié)

到這里,基本上就完成了WGCNA所有可視化工作了,下一章將介紹一下如何篩選關(guān)鍵的hubgene。

本公眾號(hào)開(kāi)發(fā)的相關(guān)軟件,Multi-omics Hammer軟件和Multi-omics Visual軟件歡迎大家使用。文末是本公眾號(hào)在其他平臺(tái)的賬戶,也歡迎大家關(guān)注并多提意見(jiàn)。

簡(jiǎn)書(shū):WJ的生信小院

博客園:生信小院

微信公眾號(hào):生信小院

最后,也歡迎各位大佬能夠在本平臺(tái)上:1傳播和講解自己發(fā)表的論文;2:發(fā)表對(duì)某一科研領(lǐng)域的看法;3:想要達(dá)成的合作或者相應(yīng)的招聘信息;4:展示自己以尋找博后工作或者博士就讀的機(jī)會(huì);5:博導(dǎo)提供博后工作或者博士攻讀機(jī)會(huì),都可以后臺(tái)給筆者留言。希望本平臺(tái)在進(jìn)行生信知識(shí)分享的同時(shí),能夠成為生信分析者的交流平臺(tái),能夠?qū)崿F(xiàn)相應(yīng)的利益互補(bǔ)和雙贏(不一定能實(shí)現(xiàn),但是夢(mèng)想總得是有的吧)。


無(wú)代碼實(shí)現(xiàn)WGCNA分析(一)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
济宁市| 新泰市| 苏尼特右旗| 进贤县| 淮滨县| 远安县| 老河口市| 区。| 远安县| 龙山县| 梁山县| 昂仁县| 莱阳市| 贵溪市| 襄城县| 涟源市| 黄石市| 大埔县| 新巴尔虎右旗| 宿迁市| 博白县| 德昌县| 昌吉市| 土默特左旗| 渭源县| 美姑县| 隆子县| 赞皇县| 家居| 澄迈县| 高唐县| 尼木县| 成都市| 海淀区| 开阳县| 辽阳市| 东城区| 尼勒克县| 卫辉市| 广昌县| 西平县|