最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

WGCNA學(xué)習(xí):WGCNA分析實戰(zhàn)

2020-11-10 21:02 作者:上天的小釗  | 我要投稿

1.WGCNA安裝

> install.packages("BiocManager")

> BiocManager::install("WGCNA")

> library(WGCNA)

2.數(shù)據(jù)準備與讀入

2.1數(shù)據(jù)準備

需要兩個數(shù)據(jù)

  1. 表達矩陣(All_fpkm.list)

  1. 表型文件(pheno.txt),需要注意表型文件分為兩類,連續(xù)變量型與分類變量型。

連續(xù)變量


分類變量
分類變量

2.2 數(shù)據(jù)讀入

library(WGCNA)

library(reshape2)

library(stringr)

setwd('D:/data/wgcna/Categorical')

options(stringsAsFactors = T)# 在讀入數(shù)據(jù)時,遇到字符串后,將其轉(zhuǎn)換成因子,連續(xù)型變量要改為FALSE

enableWGCNAThreads()#打開多線程

##====================step 1 :數(shù)據(jù)讀入

RNAseq_voom <- fpkm ## 因為WGCNA針對的是基因進行聚類,而一般我們的聚類是針對樣本用hclust即可,所以這個時候需要轉(zhuǎn)置

WGCNA_matrix = t(RNAseq_voom[order(apply(RNAseq_voom,1,mad), decreasing = T)[1:5000],])

datExpr <- WGCNA_matrix ?## top 5000 mad genes #明確樣本數(shù)和基因

nGenes = ncol(datExpr)

nSamples = nrow(datExpr) #首先針對樣本做個系統(tǒng)聚類 datExpr_tree<-hclust(dist(datExpr), method = "average")

par(mar = c(0,5,2,0))

png("img/step1-sample-cluster.png",width = 800,height = 600)

plot(datExpr_tree, main = "Sample clustering", sub="", xlab="", cex.lab = 2, ? ? ? cex.axis = 1, cex.main = 1,cex.lab=1)

dev.off()


樣本聚類

3. β值估計

##====================step 2:β值確定====

datExpr[1:4,1:4]

powers = c(c(1:10), seq(from = 12, to=20, by=2)) #設(shè)置beta值的取值范圍 sft = pickSoftThreshold(datExpr, RsquaredCut = 0.9,powerVector = powers, verbose = 5) #設(shè)置網(wǎng)絡(luò)構(gòu)建參數(shù)選擇范圍,計算無尺度分布拓撲矩陣

png("img/step2-beta-value.png",width = 800,height = 600)

par(mfrow = c(1,2));

cex1 = 0.9;

# Scale-free topology fit index as a function of the soft-thresholding power

plot(sft$fitIndices[,1], -sign(sft$fitIndices[,3])*sft$fitIndices[,2], ? ? ??? xlab="Soft Threshold (power)",ylab="Scale Free Topology Model Fit,signed??

??? R^2",type="n", ? ? ?

??? main = paste("Scale independence"));

text(sft$fitIndices[,1], -sign(sft$fitIndices[,3])*sft$fitIndices[,2], ? ? ?? labels=powers,cex=cex1,col="red");

# this line corresponds to using an R^2 cut-off of h

abline(h=0.90,col="red")

# Mean connectivity as a function of the soft-thresholding power plot(sft$fitIndices[,1], sft$fitIndices[,5],xlab="Soft Threshold (power)",ylab="Mean Connectivity", type="n",main = paste("Mean connectivity"))

text(sft$fitIndices[,1], sft$fitIndices[,5], labels=powers, cex=cex1,col="red") dev.off()

β值

可以確定最佳β值為6

4. 一步法構(gòu)建共表達矩陣

最核心的一步,同時也是最耗費計算資源的一步

##====================step 3:自動構(gòu)建WGCNA模型==================

# 首先是一步法完成網(wǎng)絡(luò)構(gòu)建

net = blockwiseModules( ?datExpr, ?power = sft$powerEstimate, ? ? ? ? ? ? #軟閾值,前面計算出來的 ?maxBlockSize = 6000, ? ? ? ? ? ? ? ? ? #最大block大小,將所有基因放在一個block中 ?TOMType = "unsigned", ? ? ? ? ? ? ? ? ?#選擇unsigned,使用標準TOM矩陣 ?deepSplit = 2, minModuleSize = 30, ? ? #剪切樹參數(shù),deepSplit取值0-4 ?mergeCutHeight = 0.25, ? ? ? ? ? ? ? ? # 模塊合并參數(shù),越大模塊越少 ?numericLabels = TRUE, ? ? ? ? ? ? ? ? ?# T返回數(shù)字,F(xiàn)返回顏色 ?pamRespectsDendro = FALSE, ? ?saveTOMs = TRUE, ?saveTOMFileBase = "FPKM-TOM", ?loadTOMs = TRUE, ?verbose = 3)


5. 模塊可視化

可以看到模塊用不同的顏色來標注,灰色模塊是無法歸類于任何模塊的基因,在后續(xù)分析的時候不需要考慮

6.模塊與性狀的關(guān)系

可以看到不同的模塊與不同的性狀是有不同的相關(guān)性的,在后續(xù)分析的時候我們可以選擇感興趣的模塊進行分析。

兩兩模塊之間的鄰接矩陣,主要看不同模塊之間的相關(guān)性

7. 選擇感興趣的模塊進行分析

由于是分類變量,只能按照0至1量化,可以看出模塊內(nèi)的基因與表型有很好的線性關(guān)系

然后再繪制性狀與模塊的關(guān)系

8.網(wǎng)絡(luò)的可視化

不知道為啥,這張圖有點奇怪

9. 模塊的導(dǎo)出

模塊導(dǎo)出后可以用cytoscape構(gòu)建網(wǎng)絡(luò),后面的教程會教大家利用這個文件構(gòu)建網(wǎng)絡(luò)圖

后記

本次WGCNA的代碼結(jié)合了生信技能樹和PlantTech的WGCNA教程,原始數(shù)據(jù)也來自這兩個教程,我將代碼和原始數(shù)據(jù)上傳到自己的github中,其中PlantTech課程是收費課程,我已將其下載,大家有需要可以去百度云下載

視頻壓縮包解壓密碼是我博客about界面下的一行小字(出自《蒲公英女孩》,標點是英文),如果鏈接炸了去博客找我聯(lián)系方式。

github:https://github.com/Bioinformatics-rookie

blog:https://www.zhouxiaozhao.cn/

WGCNA學(xué)習(xí):WGCNA分析實戰(zhàn)的評論 (共 條)

分享到微博請遵守國家法律
上林县| 台东市| 扬州市| 依安县| 桦南县| 通道| 灌云县| 河东区| 威宁| 拜泉县| 资兴市| 富阳市| 汉中市| 九江市| 元氏县| 石棉县| 通化市| 香格里拉县| 安义县| 沁源县| 乌苏市| 威宁| 涞源县| 辉县市| 佛冈县| 彩票| 平陆县| 东城区| 南木林县| 克什克腾旗| 临邑县| 共和县| 渭南市| 信阳市| 阿克苏市| 墨玉县| 汕头市| 康保县| 徐闻县| 万荣县| 凤城市|