LAASO的非癌癥形態(tài),LASSO的診斷分析
爾云間? 一個專門做科研的團(tuán)隊
? ?

首先是準(zhǔn)備兩個數(shù)據(jù)集,一個是分組的數(shù)據(jù),另一個是基因表達(dá)數(shù)據(jù)。
分組數(shù)據(jù)是兩分組,用0和1表示?;虮磉_(dá)數(shù)據(jù)就是基因的表達(dá)量了,不過這里要注意的是行為樣本,列為基因。
library(glmnet)#載入所需R包
y <- read.table(file = "Y.txt",header = T,sep = "\t",row.names = 1)#載入分組數(shù)據(jù)
x <- read.table(file = "X.txt",header = T,sep = "\t",row.names = 1)#載入表達(dá)數(shù)據(jù)
x<-as.matrix(x)#建立矩陣數(shù)據(jù)
y<-as.matrix(y)#建立矩陣數(shù)據(jù)
y[1:5,]#數(shù)據(jù)預(yù)覽
x[1:5,]#數(shù)據(jù)預(yù)覽
set.seed(20201015)
fit = glmnet(x, y, family = " binomial")#執(zhí)行LASSO分析,這個參數(shù)就是用于二分組時的分析參數(shù),做預(yù)后分析的時候就是cox
par(mar=c(5,5,3,2),cex = 0.8)
plot(fit,cex.axis=1)#繪制LASSO曲線圖
cvfit = cv.glmnet(x, y, family = " binomial")#執(zhí)行交叉驗證
par(mar=c(5,5,3,2),cex = 0.8)
plot(cvfit,cex.axis=0.8)#繪制交叉驗證圖
coef.min = coef(cvfit, s = "lambda.min")#提取lambda取最小值時的LASSO系數(shù)
active.min = which(coef.min != 0)#提取不為0的LASSO系數(shù)
index.min = coef.min[active.min]
index.min
coef.min
最后得到兩張圖,如下圖所示:
圖一

圖二

小果的這個數(shù)據(jù)最后是得到了5個基因,這樣就可以對這些基因繼續(xù)進(jìn)行分析了。

這就是今天的主要內(nèi)容了,希望對小伙伴們的分析有幫助,小果覺得這個還是挺實(shí)用的,小伙伴們覺得如何呢?小伙伴們有問題歡迎來和小果分享討論啊。
推薦閱讀
shengxinguoer
生信果
生信硬核知識解答
和小果一起學(xué)生信